2025.12.18.04 过去4小时全球AI发生了什么?

过去4小时全球AI要闻回顾

  1. 谷歌发布突破性Gemini 3 Flash模型,性能超越Pro版

    谷歌正式发布了其创新的 Gemini 3 Flash 模型,并将其设为Gemini App和搜索AI模式的默认模型。该模型实现了Pro级智能与Flash级速度的结合,在几乎所有基准测试中均超越了Gemini 2.5 Pro,并提供了三倍的速度提升和显著的成本降低。Gemini 3 Flash具备博士级逻辑与推理能力,可根据问题复杂度动态调整思考时间,并且在完成同等任务时平均使用30%更少的Token。令人瞩目的是,它在MMMU-Pro多模态理解、SWE-bench verified和ARC-AGI-2等基准测试中甚至超越了更强大的Gemini 3 Pro,使其成为实时交互式应用、快速编码、高并发API请求和低延迟多模态AI的理想选择。

  2. OpenAI推出Images 1.5,GPT 5.2 Pro带来范式转变

    OpenAI 正式发布了 Images 1.5 模型,该模型现已在ChatGPT和API中上线。Images 1.5在图像生成质量、速度和编辑能力方面均有显著提升,标志着图像生成领域的新一轮竞争。与此同时,有用户反馈称 GPT 5.2 Pro在专业应用中带来了**“范式转变”**,尤其是在代数几何和数论等复杂研究领域,其长期工作能力和高级推理能力得到了大幅增强。

  3. 多款开放模型发布,推动AI生态发展

    AI领域持续活跃,多款开放模型相继发布。小米MiMo-V2-Flash作为一款309B参数的开源MoE模型亮相,以“快于闪电”的速度和为Agentic AI设计为特点,在参数更少的情况下与K2/DSV3.2等模型竞争。Molmo 2在图像和视频任务中树立了新的SOTA标准,提供三种尺寸,并基于SigLIP2 + Qwen3构建,其4B模型在视频指向/计数方面表现卓越,且采用Apache 2.0开源许可证。此外,MSL发布了专注于音频的SAM Audio模型,腾讯也推出了具备实时交互和长期记忆能力的HY World 1.5 (WorldPlay)世界模型。NVIDIA的Nemotron 3在Hugging Face上排名第三,进一步巩固了其在开源AI领域的领导地位。

  4. 谷歌创始人谢尔盖·布林斯坦福百年庆典演讲精要

    谷歌联合创始人谢尔盖·布林在斯坦福工程学院百年庆典上的回归演讲引发广泛关注。他回顾了Google的创立历程中的成功与失败,并强调了以研究为导向的文化和信任技术人才的重要性。布林对AI的未来持乐观态度,认为AI将赋予个人更大能力,尤其在创意性任务上表现出色,但同时也承认AI仍有不足,需持续监督。他向学生们提出关于大学未来角色的深刻思考,并指出AI与量子计算在材料科学和分子生物学等领域存在被低估的巨大潜力。

  5. AI机器人Reachy Mini/Lite陆续交付,掀起机器人开发热潮

    由Pollen Robotics和Hugging Face联合开发的Reachy Mini/Mini Lite机器人开始陆续交付给用户。多位用户在社交媒体上分享了收到机器人的喜悦,并表示已准备好进行“黑客”和开发。这表明小型、可编程AI机器人在社区中受到了热烈欢迎,预示着一个积极的动手实践和机器人创新阶段的到来。

  6. 微软AI CEO警告:未来3-7年AI将迎来最不稳定时期

    微软AI首席执行官穆斯塔法·苏莱曼(Mustafa Suleyman)发出了警示,指出未来3到7年将是AI领域“最不稳定的章节”。这一预测强调了人工智能技术可能带来的深远且潜在颠覆性的社会和技术变革,预示着一个充满挑战与不确定性的快速发展时期。

  7. Google Labs推出Gmail实验性AI生产力代理“CC”

    Google Labs推出了一款名为“CC”的实验性AI生产力代理,它将集成到Gmail中。该代理旨在通过提供“你的一天展望”简报来提升用户的工作效率,帮助用户更有效地管理日程和信息流,进一步智能化日常邮件处理和任务规划。

  8. Gemini App深度研究功能升级,融入视觉学习体验

    Gemini App的深度研究功能迎来了升级,现在不仅能提供深入的文字信息,还能够通过可视化方式呈现学习内容。这项功能旨在提升用户的学习体验,使其在研究复杂主题时能更直观地理解和吸收信息,实现了阅读与视觉理解的结合。

  9. AI提示词工程新趋势:讽刺漫画与3D图标生成

    近期,AI提示词工程领域展示了新的创造力。有用户分享了如何通过提示词生成丁聪风格的讽刺漫画,主题直指当前社交网络上所谓的“AI高人”——“Prompt Kiddie”(提示词小子),讽刺他们仅复制粘贴提示词的行为。此外,还有生成受迪特·拉姆斯博朗(Dieter Rams Braun)设计启发的高度详细3D等距图标的提示词被广泛分享,显示了AI在特定艺术风格和精确设计生成方面的潜力。