2025.12.17.12 过去4小时全球AI发生了什么？

Dec 17, 2025 · 1 分钟阅读 ·

分享到:

过去4小时全球AI要闻回顾

以下是过去一段时间全球AI领域的最新动态：

OpenAI发布Images 1.5，提升图像生成与编辑能力-Sam Altman
OpenAI首席执行官Sam Altman宣布，Images 1.5已在ChatGPT和API中正式上线。新版本在图像质量、生成速度和编辑功能方面均有显著提升，并提供了丰富的示例展示其能力。此次发布预计将进一步激发图像生成领域的热潮。
Google创始人谢尔盖·布林斯坦福大学演讲：回顾谷歌与AI的未来-向阳乔木
Google联合创始人谢尔盖·布林在斯坦福工程学院百年庆典上发表了深入演讲，回顾了Google的创立历程及其在AI时代的机遇与挑战。他坦承Google曾错失Transformer论文的早期机会，并对AI在创意性任务上的潜力、工业界与学术界角色的演变，以及大学教育的未来进行了深刻反思。
小米推出MiMo-V2-Flash，309B开源MoE模型提升Agentic AI性能-clem 🤗
小米发布了MiMo-V2-Flash，一个参数总量达309B的开源Mixture-of-Experts (MoE) 模型。该模型专为Agentic AI设计，提供高达150 tokens/s的生成速度，并采用混合滑动窗口注意力机制。MiMo-V2-Flash在27万亿tokens上进行了训练，使用FP8混合精度，展现出在开放模型领域与顶尖模型竞争的强大实力。
Google DeepMind播客收官，Gmail集成AI生产力助手“CC”-Demis Hassabis
Google DeepMind负责人Demis Hassabis宣布，Google DeepMind播客本季圆满结束，探讨了计算的边界与心智本质。同时，Google Labs推出了一项名为“CC”的实验性AI生产力代理，该代理将集成至Gmail，为用户提供“今日日程”等智能简报服务。此外，Gemini的深度研究功能也得到了强化。
Molmo 2在图像和视频任务中刷新开放模型SOTA纪录-merve
Molmo 2作为一款基于SigLIP2 + Qwen3的开放模型，在图像和视频任务中树立了新的SOTA（State-of-the-Art）基准。该模型提供三种尺寸版本，其中包含一个专门用于视频指向/计数任务的4B模型，并以Apache 2.0许可证发布，同时公开了图像和视频数据集。
MSL发布新开源音频模型SAM Audio-clem 🤗
MSL（Microsoft Research Asia’s Speech and Language Group，根据上下文判断）发布了全新的开源音频模型SAM Audio，旨在推动音频AI技术的发展。
腾讯推出HY World 1.5 (WorldPlay) 世界模型，支持实时交互与长期记忆-clem 🤗
腾讯发布了其最新世界模型HY World 1.5，又名WorldPlay。该模型具备实时交互和长期记忆能力，预示着在创建更沉浸式和响应式AI环境方面的进步。
Claude代码编辑器迎来多项更新-向阳乔木
Claude代码编辑器进行了功能更新，包括新增语法高亮、提供提示词建议、上线官方插件市场以及支持可分享的访客通行证，旨在提升开发者的使用体验和协作效率。
AI智能成本三年内下降千倍，创新普及度大幅提升-Peter H. Diamandis, MD
Peter H. Diamandis博士指出，在过去三年中，人工智能的成本下降了近1000倍，极大地降低了创新的门槛。他展望未来十年，预示着AI技术将更加普及和易于获取。
GPT 5.2 Pro获得用户广泛好评，被赞为“范式转变”-Sam Altman
Sam Altman转发多条用户反馈，显示GPT 5.2 Pro在实际应用中，尤其是在代数几何和数论研究等复杂领域，被认为是实用性上的“范式转变”，显著提升了用户长时间工作的效率和效果。
HuggingFace与Pollen Robotics合作的Reachy机器人开始交付-clem 🤗
HuggingFace与Pollen Robotics合作开发的Reachy和Reachy Mini机器人已开始向用户交付。此举标志着面向开发者和爱好者的可访问机器人技术取得了进展，有助于推动社区在机器人领域的探索和应用。
Amjad Masad分享Replit验证/测试Agent构建经验及Stripe集成直播-Amjad Masad
Replit首席执行官Amjad Masad分享了关于如何构建其验证/测试Agent的经验，这为自动化代码质量和开发流程提供了见解。此外，他还主持了一场直播会话，演示了如何在项目中添加Stripe支付和订阅功能。