2025.12.17.12 过去4小时全球AI发生了什么?
过去4小时全球AI要闻回顾
以下是过去一段时间全球AI领域的最新动态:
OpenAI发布Images 1.5,提升图像生成与编辑能力-Sam Altman
OpenAI首席执行官Sam Altman宣布,Images 1.5已在ChatGPT和API中正式上线。新版本在图像质量、生成速度和编辑功能方面均有显著提升,并提供了丰富的示例展示其能力。此次发布预计将进一步激发图像生成领域的热潮。
Google创始人谢尔盖·布林斯坦福大学演讲:回顾谷歌与AI的未来-向阳乔木
Google联合创始人谢尔盖·布林在斯坦福工程学院百年庆典上发表了深入演讲,回顾了Google的创立历程及其在AI时代的机遇与挑战。他坦承Google曾错失Transformer论文的早期机会,并对AI在创意性任务上的潜力、工业界与学术界角色的演变,以及大学教育的未来进行了深刻反思。
小米推出MiMo-V2-Flash,309B开源MoE模型提升Agentic AI性能-clem 🤗
小米发布了MiMo-V2-Flash,一个参数总量达309B的开源Mixture-of-Experts (MoE) 模型。该模型专为Agentic AI设计,提供高达150 tokens/s的生成速度,并采用混合滑动窗口注意力机制。MiMo-V2-Flash在27万亿tokens上进行了训练,使用FP8混合精度,展现出在开放模型领域与顶尖模型竞争的强大实力。
Google DeepMind播客收官,Gmail集成AI生产力助手“CC”-Demis Hassabis
Google DeepMind负责人Demis Hassabis宣布,Google DeepMind播客本季圆满结束,探讨了计算的边界与心智本质。同时,Google Labs推出了一项名为“CC”的实验性AI生产力代理,该代理将集成至Gmail,为用户提供“今日日程”等智能简报服务。此外,Gemini的深度研究功能也得到了强化。
Molmo 2在图像和视频任务中刷新开放模型SOTA纪录-merve
Molmo 2作为一款基于SigLIP2 + Qwen3的开放模型,在图像和视频任务中树立了新的SOTA(State-of-the-Art)基准。该模型提供三种尺寸版本,其中包含一个专门用于视频指向/计数任务的4B模型,并以Apache 2.0许可证发布,同时公开了图像和视频数据集。
MSL(Microsoft Research Asia’s Speech and Language Group,根据上下文判断)发布了全新的开源音频模型SAM Audio,旨在推动音频AI技术的发展。
腾讯推出HY World 1.5 (WorldPlay) 世界模型,支持实时交互与长期记忆-clem 🤗
腾讯发布了其最新世界模型HY World 1.5,又名WorldPlay。该模型具备实时交互和长期记忆能力,预示着在创建更沉浸式和响应式AI环境方面的进步。
Claude代码编辑器进行了功能更新,包括新增语法高亮、提供提示词建议、上线官方插件市场以及支持可分享的访客通行证,旨在提升开发者的使用体验和协作效率。
AI智能成本三年内下降千倍,创新普及度大幅提升-Peter H. Diamandis, MD
Peter H. Diamandis博士指出,在过去三年中,人工智能的成本下降了近1000倍,极大地降低了创新的门槛。他展望未来十年,预示着AI技术将更加普及和易于获取。
GPT 5.2 Pro获得用户广泛好评,被赞为“范式转变”-Sam Altman
Sam Altman转发多条用户反馈,显示GPT 5.2 Pro在实际应用中,尤其是在代数几何和数论研究等复杂领域,被认为是实用性上的“范式转变”,显著提升了用户长时间工作的效率和效果。
HuggingFace与Pollen Robotics合作的Reachy机器人开始交付-clem 🤗
HuggingFace与Pollen Robotics合作开发的Reachy和Reachy Mini机器人已开始向用户交付。此举标志着面向开发者和爱好者的可访问机器人技术取得了进展,有助于推动社区在机器人领域的探索和应用。
Amjad Masad分享Replit验证/测试Agent构建经验及Stripe集成直播-Amjad Masad
Replit首席执行官Amjad Masad分享了关于如何构建其验证/测试Agent的经验,这为自动化代码质量和开发流程提供了见解。此外,他还主持了一场直播会话,演示了如何在项目中添加Stripe支付和订阅功能。