2025.12.18.08 过去4小时全球AI发生了什么?

  1. Google发布Gemini 3 Flash模型,性能超越Pro版且速度更快-小互

    Google正式发布了 Gemini 3 Flash 模型,其性能在MMMU-Pro、SWE-Bench Verified和Arc-AGI-2等多模态理解基准测试中超越了Gemini 3 Pro,同时速度提升三倍,成本大幅降低。该模型具备博士级逻辑与推理能力,能根据问题复杂度动态调节思考时间,并平均减少30%的tokens使用。Gemini 3 Flash现已成为Gemini App和AI Mode in Search的默认模型,适用于实时交互式应用、快速编码、高并发API请求及低延迟多模态AI场景。

  2. xAI Grok语音代理迅速移植到Reachy Mini机器人-clem 🤗

    xAI的 Grok语音代理 在不到一小时内成功移植到了Reachy Mini机器人上,由@atariorbit完成。这是Grok语音API在机器人上的首次实现,虽然尚未完美,但潜力巨大。Grok语音代理在音频推理基准测试Big Bench Audio上排名第一,预示着将为机器人代理解锁更多有趣的语音交互和问题解决应用场景。

  3. Nvidia Nemotron 3 Nano在Hugging Face上表现强劲-clem 🤗

    Nvidia的 Nemotron 3 Nano 模型 在Hugging Face平台上表现出色,已成为第三大热门模型,并且在文本生成模型前十名中占据四席。这一趋势表明Nvidia正迅速崛起为开源AI领域的重要力量,其轻量级模型在开发者社区中获得广泛关注和认可。

  4. Meta推出“SAM Audio”模型实现声音分割-宝玉

    Meta发布了 “SAM Audio”AI 模型,旨在实现像图像分割(如Photoshop抠图)一样轻松地“抠声音”。该模型能够理解并分割复杂音频中的任意声音元素,例如一键提取吉他声,为音频处理和创作带来了革命性的新工具。

  5. AI在医疗领域加速普及,医生日常使用率高达67%-Emad

    一项研究显示,AI在医疗领域的采用率正在迅速提高。高达 67%的医生每天使用AI工具,84%的医生认为AI让他们成为更好的医生,而42%的医生表示AI提高了他们的工作效率。这反映了AI技术在改善医疗服务和提升专业人士能力方面的巨大潜力。

  6. 中国计划到2026年部署50万个AI加速器-Peter H. Diamandis, MD

    根据最新消息,中国计划到2026年建立 50万个AI加速器。这一举措标志着中国在先进芯片领域寻求“脱钩”的战略,旨在减少对曾经占据中国市场95%的Nvidia等外国供应商的依赖,推动本土AI硬件生态的发展。

  7. 微软AI首席执行官警告未来3至7年AI可能带来剧烈动荡-Peter H. Diamandis, MD

    微软AI首席执行官Mustafa Suleyman警告,未来 3到7年可能是AI发展中最具破坏性和不稳定的时期。他同时指出,微软的重心并非“赢得”AGI竞赛,而是致力于实现 AI的自给自足,以确保技术发展的自主性和控制力。

  8. 关于“Prompt Kiddie”现象的讽刺漫画提示词分享-宝玉

    有作者分享了一个讽刺漫画的提示词,以丁聪的风格描绘了当前社交网络上所谓的“AI高人”——他们不过是“Prompt Kiddie(提示词小子)”,整天转发提示词,实则在自动充当大模型的燃料。这反映了对当前AI领域一些浮躁现象的批判。