2025.12.12.08 过去4小时全球AI发生了什么？

Dec 12, 2025 · 1 分钟阅读 ·

分享到:

在过去的四小时内，AI领域迎来了一系列重要进展和发布。OpenAI 推出了其最新的GPT-5.2模型，显著提升了多项性能指标，并预告了“成人模式”的到来。同时，OpenAI与迪士尼达成了里程碑式的合作，允许Sora使用迪士尼的200多个标志性IP进行AI视频创作。此外，Hugging Face平台上一款文本生成模型Rnj-1-Instruct登顶趋势榜，Google DeepMind展示了其Gemini Deep Research智能体，并有新的工具和平台用于AI模型训练和机器人应用开发。

以下是详细新闻：

OpenAI 发布 GPT-5.2，成人模式明年第一季度推出 - 宝玉
OpenAI 正式发布了其最新模型 GPT-5.2，旨在大幅提升 ChatGPT 在编程、科学研究及各类工作任务中的表现。该模型在 GDPval评估中得分超过70% (GPT-5仅为38%)，并在 SWE-Bench Pro编程能力测试中取得55.6%的最新SOTA水平，超越了Claude Opus 4.5和Gemini 3 Pro。GPT-5.2在长上下文推理方面也树立了新标杆，MRCR v2指标下在256k token的长文档中实现近100%准确率。此外，该模型显著降低了30%的“幻觉”错误率，并在视觉理解方面错误率减半。Sam Altman表示，尽管面临谷歌Gemini 3的竞争，但冲击小于预期，并预告了明年第一季度将推出**“成人模式”，允许经认证的用户访问特定内容。值得注意的是，GPT-5.2的价格相比5.1版本上涨了40%**。
OpenAI与迪士尼达成三年期合作，Sora将可用于迪士尼IP视频创作 - 宝玉
迪士尼公司与OpenAI正式宣布达成一项为期三年的里程碑式合作协议。该协议将允许OpenAI的Sora模型使用迪士尼旗下超过200个标志性IP角色，包括迪士尼、皮克斯、漫威和星球大战系列，进行AI短视频创作。Sam Altman对此表示非常高兴，认为迪士尼是全球最优秀的讲故事公司，用户对用其角色生成内容的需求非常强烈，此次合作将为Sora和图像生成带来更多“魔法”。
Rnj-1-Instruct 成为Hugging Face上排名第一的文本生成模型 - clem 🤗
由ashVaswani发布的消息显示，Rnj-1-Instruct模型已成为Hugging Face平台上趋势排名第一的文本生成模型。这表明该模型在社区中获得了广泛关注和认可，可能因其优异的性能或独特的特性在文本生成领域脱颖而出。
Google DeepMind推出Gemini Deep Research智能体 - Demis Hassabis
Google DeepMind为开发者推出了Gemini Deep Research智能体。该智能体具备强大的规划能力，能够识别研究中的不足之处，并自主导航复杂的研发流程。此外，DeepMind还成功在Nvidia H100 GPU (Starcloud-1) 上运行了其Gemma模型的推理任务。
AutoGLM：一个可操作手机的AI智能体发布 - clem 🤗
Zai_org团队推出了令人惊叹的 AutoGLM AI智能体，该智能体具备使用手机的能力。其模型已在MIT许可证下开源发布，所有相关代码也已公开。这一进展展示了AI在与物理设备交互和执行复杂任务方面的潜力，为未来的人机交互开辟了新路径。
Andrew Ng分享构建高度自主但“不可靠”的AI智能体方法 - Andrew Ng
著名AI科学家Andrew Ng分享了一种使用开源 aisuite工具包 构建高度自主、能力适中但“不可靠”的AI智能体的有趣方法。通过几行代码，可以将前沿的LLM与磁盘访问或网络搜索等工具结合，并设定高级任务（如创建贪吃蛇游戏或进行深度研究），观察LLM的自主行为。他强调，这主要用于实验目的，目前实际应用中的智能体仍需更复杂的框架。
Hugging Face Skills库简化LLM训练流程 - merve
Hugging Face的Skills库提供了一系列自动化功能，允许用户利用其选择的LLM完成多项任务。其中的model-trainer技能能够指导LLM应用SFT、DPO和GRPO等训练方法，并利用Hugging Face Jobs在GPU上运行脚本，大幅简化了模型训练的流程。此外，DPO（Direct Preference Optimization）也同样适用。
Reachy Mini机器人开放SDK/API和模拟平台，鼓励社区开发应用 - clem 🤗
Reachy Mini机器人现已开放其SDK、API和模拟平台，邀请社区开发者创建并分享应用程序。即使没有实体机器人，用户也可以通过SDK、API和模拟环境进行开发。项目方计划近期将试用社区开发的简单应用，并分享视频，为开发者提供可见度。发布者还列举了多项应用创意，包括播放音乐、翻译、物体识别和房间描述等。
Banana Pro高质量图像生成提示词及技巧分享 - 宝玉
“宝玉”分享了关于Banana Pro图像生成的9个高品质保障技巧，建议用户在Gemini Web/App中点击“下载”以获取最终质量，务必开启“Thinking”模式（API默认开启），并在Prompt中指定2K分辨率，尤其在绘制大量细节时。此外，还分享了一个用于生成“漂流瓶中的黑珍珠号”和“粘土动画风格”图像的详细提示词范例。