2025.12.18.12 过去4小时全球AI发生了什么？

Dec 18, 2025 · 1 分钟阅读 ·

分享到:

以下是过去4小时内全球AI领域的重要动态：

Google发布Gemini 3 Flash模型，性能与效率均实现突破-Demis Hassabis
Google正式发布了Gemini 3 Flash模型，并已将其设为Gemini App和Search中AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合，在MMMU-Pro多模态理解基准测试、swe-bench verified和arc-agi-2等多个测试集中，其性能甚至超越了Gemini 3 Pro，同时速度提升3倍，成本大幅降低。Gemini 3 Flash具备博士级逻辑与推理能力，能根据问题复杂度“自己调节思考时间”，并在完成同等任务时平均使用30%更少的tokens，使其成为单位智能成本效率最高的模型。它特别适用于实时交互式应用（如语音助手、游戏、教育工具）、快速编码与分析任务、高并发API请求环境以及低延迟多模态AI应用。
Grok语音代理首次在Reachy Mini机器人上实现，助力新型机器人应用-clem 🤗
xAI的Grok语音API首次在机器人上成功部署，并迅速被移植到Reachy Mini机器人上，仅用不到一小时。这一集成由@atariorbit实现，有望为机器人代理解锁令人兴奋的新用例。Grok语音代理在Big Bench Audio（衡量语音代理解决复杂问题能力的领先音频推理基准）上排名第一，显示出其强大的音频推理能力。同时，多位用户也纷纷晒出他们收到的Reachy Mini机器人，并开始进行调试和开发。
NVIDIA Nemotron 3 Nano模型在Hugging Face上表现亮眼-clem 🤗
NVIDIA的Nemotron 3 Nano模型在Hugging Face平台上持续获得关注，目前已位列趋势榜前三，甚至有四款Nemotron 3 Nano模型进入了文本生成模型前十。这一趋势表明NVIDIA正逐渐成为开源AI领域的重要力量。
微软AI战略重心转向AI自给自足，而非追求AGI竞赛胜利-Peter H. Diamandis, MD
Peter H. Diamandis博士指出，微软目前真正的重点在于实现AI的自给自足，而非仅仅赢得通用人工智能（AGI）的竞赛。与此同时，微软AI首席执行官Mustafa Suleyman也警告称，未来3到7年可能是AI领域最具颠覆性的时期。
AI在医疗领域应用迅速普及，医生对其持高度肯定态度-Emad
一项研究显示，医生对AI的采用率非常高且增长迅速：67%的医生表示他们每天都在使用AI，84%的医生认为AI能让他们成为更好的医生，而42%的医生则表示AI使得他们的工作效率更高。
Meta推出SAM Audio，实现声音的“图像式”分割-宝玉
Meta发布了**“SAM Audio”AI模型**，旨在让声音也能像图像一样被轻松分割。该模型类似于“Photoshop抠图”的功能，但应用于音频领域，能够理解并“分割”复杂音频中的任意声音元素，例如一键提取吉他声，为音频处理带来革新。
呼吁培养AI构建者，而非仅仅是AI用户-clem 🤗
有观点呼吁，我们应该致力于培养新一代的AI构建者，而不仅仅是AI用户，强调创新和开发在AI发展中的重要性。
中国AI加速器雄心勃勃，计划2026年部署50万个-Peter H. Diamandis, MD
Peter H. Diamandis博士提到，Nvidia曾一度占据中国先进芯片市场95%的份额，但现在中国计划到2026年建立50万个AI加速器。这一举动被视为中美在高科技领域“脱钩”的明确信号。
ManusAI实现惊人增长，8个月内ARR达到1亿美元-Emad
ManusAI公司在短短8个月内实现了从0到1亿美元年度经常性收入（ARR）的惊人增长。自3月发布以来，已处理了超过147万亿个tokens，并创建了超过8000万个虚拟计算机。
讽刺漫画揭示“提示词小子”现象-宝玉
社交媒体上出现一幅讽刺漫画，以丁聪的风格描绘了当下被追捧的所谓“AI高人”不过是“Prompt Kiddie（提示词小子）”，他们整天转发提示词，实际上是在自动充当大模型的燃料，引发对AI使用和专业性的思考。