2025.12.18.12 过去4小时全球AI发生了什么?
以下是过去4小时内全球AI领域的重要动态:
Google发布Gemini 3 Flash模型,性能与效率均实现突破-Demis Hassabis
Google正式发布了Gemini 3 Flash模型,并已将其设为Gemini App和Search中AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合,在MMMU-Pro多模态理解基准测试、swe-bench verified和arc-agi-2等多个测试集中,其性能甚至超越了Gemini 3 Pro,同时速度提升3倍,成本大幅降低。Gemini 3 Flash具备博士级逻辑与推理能力,能根据问题复杂度“自己调节思考时间”,并在完成同等任务时平均使用30%更少的tokens,使其成为单位智能成本效率最高的模型。它特别适用于实时交互式应用(如语音助手、游戏、教育工具)、快速编码与分析任务、高并发API请求环境以及低延迟多模态AI应用。
Grok语音代理首次在Reachy Mini机器人上实现,助力新型机器人应用-clem 🤗
xAI的Grok语音API首次在机器人上成功部署,并迅速被移植到Reachy Mini机器人上,仅用不到一小时。这一集成由@atariorbit实现,有望为机器人代理解锁令人兴奋的新用例。Grok语音代理在Big Bench Audio(衡量语音代理解决复杂问题能力的领先音频推理基准)上排名第一,显示出其强大的音频推理能力。同时,多位用户也纷纷晒出他们收到的Reachy Mini机器人,并开始进行调试和开发。
NVIDIA Nemotron 3 Nano模型在Hugging Face上表现亮眼-clem 🤗
NVIDIA的Nemotron 3 Nano模型在Hugging Face平台上持续获得关注,目前已位列趋势榜前三,甚至有四款Nemotron 3 Nano模型进入了文本生成模型前十。这一趋势表明NVIDIA正逐渐成为开源AI领域的重要力量。
微软AI战略重心转向AI自给自足,而非追求AGI竞赛胜利-Peter H. Diamandis, MD
Peter H. Diamandis博士指出,微软目前真正的重点在于实现AI的自给自足,而非仅仅赢得通用人工智能(AGI)的竞赛。与此同时,微软AI首席执行官Mustafa Suleyman也警告称,未来3到7年可能是AI领域最具颠覆性的时期。
AI在医疗领域应用迅速普及,医生对其持高度肯定态度-Emad
一项研究显示,医生对AI的采用率非常高且增长迅速:67%的医生表示他们每天都在使用AI,84%的医生认为AI能让他们成为更好的医生,而42%的医生则表示AI使得他们的工作效率更高。
Meta推出SAM Audio,实现声音的“图像式”分割-宝玉
Meta发布了**“SAM Audio”AI模型**,旨在让声音也能像图像一样被轻松分割。该模型类似于“Photoshop抠图”的功能,但应用于音频领域,能够理解并“分割”复杂音频中的任意声音元素,例如一键提取吉他声,为音频处理带来革新。
有观点呼吁,我们应该致力于培养新一代的AI构建者,而不仅仅是AI用户,强调创新和开发在AI发展中的重要性。
中国AI加速器雄心勃勃,计划2026年部署50万个-Peter H. Diamandis, MD
Peter H. Diamandis博士提到,Nvidia曾一度占据中国先进芯片市场95%的份额,但现在中国计划到2026年建立50万个AI加速器。这一举动被视为中美在高科技领域“脱钩”的明确信号。
ManusAI实现惊人增长,8个月内ARR达到1亿美元-Emad
ManusAI公司在短短8个月内实现了从0到1亿美元年度经常性收入(ARR)的惊人增长。自3月发布以来,已处理了超过147万亿个tokens,并创建了超过8000万个虚拟计算机。
社交媒体上出现一幅讽刺漫画,以丁聪的风格描绘了当下被追捧的所谓“AI高人”不过是“Prompt Kiddie(提示词小子)”,他们整天转发提示词,实际上是在自动充当大模型的燃料,引发对AI使用和专业性的思考。