2025.12.17.20 过去4小时全球AI发生了什么?
OpenAI发布Images 1.5图像生成模型及GPT 5.2 Pro更新 OpenAI今日正式推出了Images 1.5模型,该模型已在ChatGPT和API中上线,旨在提供更优质、更快速的图像生成和编辑能力。OpenAI CEO Sam Altman表示,Images 1.5在多方面取得了显著提升,并展示了通过ChatGPT轻松创建有趣图像的示例。此外,有用户反馈称GPT 5.2 Pro在代数几何和数论研究等专业应用中带来了“范式转变”,显著提升了其工作效率和实用性。
Google创始人谢尔盖·布林斯坦福大学百年庆典深度对话 Google创始人谢尔盖·布林(Sergey Brin)在斯坦福工程学院百年庆典上进行了长篇对话。他坦诚分享了Google的早期发展、PageRank的诞生、联邦科研经费的重要性,以及Google在AI领域曾犯的错误,例如未充分重视Transformer论文导致OpenAI的崛起。布林还探讨了AI在创意领域的潜力,并对未来大学的形态提出了思考,认为知识传播方式的改变将重塑教育模式。他强调,人工智能和量子计算在材料科学等领域的应用前景被严重低估,并指出保持技术性、创造性出口对于个人成长至关重要。
小米MiMo-V2-Flash开源MoE模型发布 小米(Xiaomi)发布了其新的开源MiMo-V2-Flash MoE模型,该模型设计用于Agentic AI,拥有309B总参数,可实现150 tokens/s的速度,并采用了混合滑动窗口注意力机制。该模型基于27T tokens数据进行训练,并支持FP8混合精度,其在基准测试中表现出色,以更少的参数与K2/DSV3.2等模型竞争,展现了强大的性能。
Molmo 2在图像和视频任务中取得新突破 Molmo 2模型在图像和视频任务的开放模型领域树立了新的SOTA(State-of-the-Art)标准。该模型基于SigLIP2和Qwen3构建,提供三种不同大小,并额外包含一个专门用于视频指向/计数任务的4B模型,其性能达到了SOTA水平。Molmo 2采用Apache 2.0许可,同时发布了相关的图像和视频数据集。
Google DeepMind发布Gmail AI效率助手“CC”及Gemini深度研究更新 Google Labs推出了一项名为“CC”的实验性AI生产力代理,该代理作为Gmail的AI效率助手,可以为用户提供“今日日程”简报。同时,Gemini应用也更新了其“深度研究(Deep Research)”功能,该功能现在不仅能提供深入的专题阅读,还能通过视觉化方式呈现相关概念,进一步提升学习体验。Google DeepMind播客也完成了新一季的收官,讨论了可计算性的前沿、心智的本质以及AI如何帮助理解宇宙奥秘。
MSL发布SAM Audio开放模型 MSL(可能指微软研究院或相关实验室)发布了其新的开放模型SAM Audio,进一步扩展了多模态AI的能力,特别是在音频处理领域。
Claude代码编辑器功能更新 Claude代码编辑器迎来多项功能更新,包括语法高亮、提示词建议、官方插件市场以及可分享的访客通行证。这些新功能旨在提升开发者的代码编写效率和协作体验。
AI智能成本大幅下降,创新更易实现 知名未来学家Peter H. Diamandis指出,过去三年间,AI的智能成本下降了近1000倍,使得创新变得前所未有的容易。他展望未来十年,预示着AI将带来更广泛的变革。他还提及,到2029年全球太阳能发电能力预计将增加6太瓦,太阳能正逐渐成为重要的基础设施。