2025.12.18.16 过去4小时全球AI发生了什么？

Dec 18, 2025 · 1 分钟阅读 ·

分享到:

Google发布Gemini 3 Flash模型：性能超越Pro版，速度与效率显著提升-小互
Google正式发布了Gemini 3 Flash模型，该模型在保持Pro级智能的同时，实现了Flash级速度，性能超越了Gemini 2.5 Pro并达到3倍速度，而成本仅为Pro版的零头。新模型具备博士级逻辑与推理能力，能在处理复杂任务时“自我调节思考时间”，平均可减少30%的token使用量。Gemini 3 Flash在MMMU-Pro多模态理解基准测试以及SWE-bench verified和ARC-AGI-2等测试集中甚至超越了Gemini 3 Pro。该模型现已作为Gemini App和AI Mode in Search的默认模型，适用于实时交互式应用、快速编码分析及低延迟多模态AI场景。
Grok语音代理成功集成至Reachy Mini机器人，解锁全新交互应用-clem 🤗
XAI的Grok语音API已成功在不到一小时内被@atariorbit移植到Reachy Mini机器人上。这是Grok语音API在机器人上的首次实现，预示着机器人代理可能迎来新的应用场景。Grok语音代理在“Big Bench Audio”音频推理基准测试中排名第一，展现了其解决复杂语音问题的强大能力。多位用户也纷纷收到自己的Reachy Mini机器人，并表示将开始进行开发和“Hacking”。
NVIDIA Nemotron 3 Nano在Hugging Face上表现强劲，跻身热门模型行列-clem 🤗
NVIDIA的Nemotron 3 Nano系列模型在Hugging Face平台迅速走红，成为开放源代码AI领域的新星。目前，Nemotron 3已位列趋势榜第三，并且前十名文本生成模型中，有四款来自Nemotron 3 Nano系列，这表明NVIDIA正成为开源AI领域的重要力量，其模型受到开发者社区的广泛关注和认可。
微软AI战略聚焦“AI自给自足”，CEO警示未来几年AI或带来动荡-Peter H. Diamandis, MD
据Peter Diamandis援引Microsoft AI CEO Mustafa Suleyman的观点，微软在AI领域的真正重心在于实现AI的自给自足，而非仅仅赢得AGI（通用人工智能）竞赛。Suleyman同时警示，未来三到七年可能是AI发展中最具破坏性的阶段，预示着AI技术可能给社会带来显著的不稳定影响。
Meta推出“SAM Audio”：实现声音的智能分割，如同图像处理中的“抠图”-宝玉
Meta发布了名为**“SAM Audio”的AI模型，旨在革新音频处理方式。该模型能够像图像处理软件（如Photoshop）进行“抠图”一样，轻松地分割和提取复杂音频中的特定声音元素**。这项技术有望在音乐制作、语音识别、环境音分析等多个领域带来突破，让用户能够更灵活、精准地操作音频内容。
AI在医疗领域展现高采用率和积极影响：67%医生日常使用，84%认为提升专业能力-Emad
一项研究指出，AI在医生群体中获得了惊人的快速和高水平采用。数据显示，67%的医生每天使用AI工具，而高达84%的医生认为AI使他们成为更好的医生。此外，42%的医生表示AI正在帮助他们…（原文内容截断）。这些数据表明，AI正积极地融入医疗实践，并被专业人士视为提升工作效率和医疗质量的有效工具。
利用AI实现播客到文章再到图片分享的自动化工作流演示-向阳乔木
有用户演示了一个创新的自动化工作流，该流程能够将播客内容自动生成为文章，随后再将文章转化为可分享的图片。这一流程极大地简化了内容创作与分发的步骤，提高了效率，展现了AI在多媒体内容转化和传播方面的强大潜力，特别适合内容创作者快速产出和推广素材。