2025.12.12.08 过去4小时全球AI发生了什么?

在过去的四小时内,AI领域迎来了一系列重要进展和发布。OpenAI 推出了其最新的GPT-5.2模型,显著提升了多项性能指标,并预告了“成人模式”的到来。同时,OpenAI与迪士尼达成了里程碑式的合作,允许Sora使用迪士尼的200多个标志性IP进行AI视频创作。此外,Hugging Face平台上一款文本生成模型Rnj-1-Instruct登顶趋势榜,Google DeepMind展示了其Gemini Deep Research智能体,并有新的工具和平台用于AI模型训练和机器人应用开发。

以下是详细新闻:

  1. OpenAI 发布 GPT-5.2,成人模式明年第一季度推出 - 宝玉

    OpenAI 正式发布了其最新模型 GPT-5.2,旨在大幅提升 ChatGPT 在编程、科学研究及各类工作任务中的表现。该模型在 GDPval评估中得分超过70% (GPT-5仅为38%),并在 SWE-Bench Pro编程能力测试中取得55.6%的最新SOTA水平,超越了Claude Opus 4.5和Gemini 3 Pro。GPT-5.2在长上下文推理方面也树立了新标杆,MRCR v2指标下在256k token的长文档中实现近100%准确率。此外,该模型显著降低了30%的“幻觉”错误率,并在视觉理解方面错误率减半。Sam Altman表示,尽管面临谷歌Gemini 3的竞争,但冲击小于预期,并预告了明年第一季度将推出**“成人模式”,允许经认证的用户访问特定内容。值得注意的是,GPT-5.2的价格相比5.1版本上涨了40%**。

  2. OpenAI与迪士尼达成三年期合作,Sora将可用于迪士尼IP视频创作 - 宝玉

    迪士尼公司与OpenAI正式宣布达成一项为期三年的里程碑式合作协议。该协议将允许OpenAI的Sora模型使用迪士尼旗下超过200个标志性IP角色,包括迪士尼、皮克斯、漫威和星球大战系列,进行AI短视频创作。Sam Altman对此表示非常高兴,认为迪士尼是全球最优秀的讲故事公司,用户对用其角色生成内容的需求非常强烈,此次合作将为Sora和图像生成带来更多“魔法”。

  3. Rnj-1-Instruct 成为Hugging Face上排名第一的文本生成模型 - clem 🤗

    由ashVaswani发布的消息显示,Rnj-1-Instruct模型已成为Hugging Face平台上趋势排名第一的文本生成模型。这表明该模型在社区中获得了广泛关注和认可,可能因其优异的性能或独特的特性在文本生成领域脱颖而出。

  4. Google DeepMind推出Gemini Deep Research智能体 - Demis Hassabis

    Google DeepMind为开发者推出了Gemini Deep Research智能体。该智能体具备强大的规划能力,能够识别研究中的不足之处,并自主导航复杂的研发流程。此外,DeepMind还成功在Nvidia H100 GPU (Starcloud-1) 上运行了其Gemma模型的推理任务。

  5. AutoGLM:一个可操作手机的AI智能体发布 - clem 🤗

    Zai_org团队推出了令人惊叹的 AutoGLM AI智能体,该智能体具备使用手机的能力。其模型已在MIT许可证下开源发布,所有相关代码也已公开。这一进展展示了AI在与物理设备交互和执行复杂任务方面的潜力,为未来的人机交互开辟了新路径。

  6. Andrew Ng分享构建高度自主但“不可靠”的AI智能体方法 - Andrew Ng

    著名AI科学家Andrew Ng分享了一种使用开源 aisuite工具包 构建高度自主、能力适中但“不可靠”的AI智能体的有趣方法。通过几行代码,可以将前沿的LLM与磁盘访问或网络搜索等工具结合,并设定高级任务(如创建贪吃蛇游戏或进行深度研究),观察LLM的自主行为。他强调,这主要用于实验目的,目前实际应用中的智能体仍需更复杂的框架。

  7. Hugging Face Skills库简化LLM训练流程 - merve

    Hugging Face的Skills库提供了一系列自动化功能,允许用户利用其选择的LLM完成多项任务。其中的model-trainer技能能够指导LLM应用SFT、DPO和GRPO等训练方法,并利用Hugging Face Jobs在GPU上运行脚本,大幅简化了模型训练的流程。此外,DPO(Direct Preference Optimization)也同样适用。

  8. Reachy Mini机器人开放SDK/API和模拟平台,鼓励社区开发应用 - clem 🤗

    Reachy Mini机器人现已开放其SDK、API和模拟平台,邀请社区开发者创建并分享应用程序。即使没有实体机器人,用户也可以通过SDK、API和模拟环境进行开发。项目方计划近期将试用社区开发的简单应用,并分享视频,为开发者提供可见度。发布者还列举了多项应用创意,包括播放音乐、翻译、物体识别和房间描述等。

  9. Banana Pro高质量图像生成提示词及技巧分享 - 宝玉

    “宝玉”分享了关于Banana Pro图像生成的9个高品质保障技巧,建议用户在Gemini Web/App中点击“下载”以获取最终质量,务必开启“Thinking”模式(API默认开启),并在Prompt中指定2K分辨率,尤其在绘制大量细节时。此外,还分享了一个用于生成“漂流瓶中的黑珍珠号”和“粘土动画风格”图像的详细提示词范例。