2025.12.17.20 过去4小时全球AI发生了什么？

Dec 17, 2025 · 1 分钟阅读 ·

分享到:

OpenAI发布Images 1.5图像生成模型及GPT 5.2 Pro更新 OpenAI今日正式推出了Images 1.5模型，该模型已在ChatGPT和API中上线，旨在提供更优质、更快速的图像生成和编辑能力。OpenAI CEO Sam Altman表示，Images 1.5在多方面取得了显著提升，并展示了通过ChatGPT轻松创建有趣图像的示例。此外，有用户反馈称GPT 5.2 Pro在代数几何和数论研究等专业应用中带来了“范式转变”，显著提升了其工作效率和实用性。
Google创始人谢尔盖·布林斯坦福大学百年庆典深度对话 Google创始人谢尔盖·布林（Sergey Brin）在斯坦福工程学院百年庆典上进行了长篇对话。他坦诚分享了Google的早期发展、PageRank的诞生、联邦科研经费的重要性，以及Google在AI领域曾犯的错误，例如未充分重视Transformer论文导致OpenAI的崛起。布林还探讨了AI在创意领域的潜力，并对未来大学的形态提出了思考，认为知识传播方式的改变将重塑教育模式。他强调，人工智能和量子计算在材料科学等领域的应用前景被严重低估，并指出保持技术性、创造性出口对于个人成长至关重要。
小米MiMo-V2-Flash开源MoE模型发布小米（Xiaomi）发布了其新的开源MiMo-V2-Flash MoE模型，该模型设计用于Agentic AI，拥有309B总参数，可实现150 tokens/s的速度，并采用了混合滑动窗口注意力机制。该模型基于27T tokens数据进行训练，并支持FP8混合精度，其在基准测试中表现出色，以更少的参数与K2/DSV3.2等模型竞争，展现了强大的性能。
Molmo 2在图像和视频任务中取得新突破 Molmo 2模型在图像和视频任务的开放模型领域树立了新的SOTA（State-of-the-Art）标准。该模型基于SigLIP2和Qwen3构建，提供三种不同大小，并额外包含一个专门用于视频指向/计数任务的4B模型，其性能达到了SOTA水平。Molmo 2采用Apache 2.0许可，同时发布了相关的图像和视频数据集。
Google DeepMind发布Gmail AI效率助手“CC”及Gemini深度研究更新 Google Labs推出了一项名为“CC”的实验性AI生产力代理，该代理作为Gmail的AI效率助手，可以为用户提供“今日日程”简报。同时，Gemini应用也更新了其“深度研究（Deep Research）”功能，该功能现在不仅能提供深入的专题阅读，还能通过视觉化方式呈现相关概念，进一步提升学习体验。Google DeepMind播客也完成了新一季的收官，讨论了可计算性的前沿、心智的本质以及AI如何帮助理解宇宙奥秘。
MSL发布SAM Audio开放模型 MSL（可能指微软研究院或相关实验室）发布了其新的开放模型SAM Audio，进一步扩展了多模态AI的能力，特别是在音频处理领域。
Claude代码编辑器功能更新 Claude代码编辑器迎来多项功能更新，包括语法高亮、提示词建议、官方插件市场以及可分享的访客通行证。这些新功能旨在提升开发者的代码编写效率和协作体验。
AI智能成本大幅下降，创新更易实现知名未来学家Peter H. Diamandis指出，过去三年间，AI的智能成本下降了近1000倍，使得创新变得前所未有的容易。他展望未来十年，预示着AI将带来更广泛的变革。他还提及，到2029年全球太阳能发电能力预计将增加6太瓦，太阳能正逐渐成为重要的基础设施。