2025.12.12.12 过去4小时全球AI发生了什么？

Dec 12, 2025 · 1 分钟阅读 ·

分享到:

以下是过去4小时全球AI领域的重要动态：

OpenAI正式发布GPT-5.2模型，性能大幅提升并调整定价-Sam Altman
OpenAI现已通过ChatGPT和API正式发布GPT-5.2模型，Sam Altman称其为目前最智能的通用模型，尤其擅长处理实际工作任务。GPT-5.2在性能上实现了显著飞跃，GDPval指标（衡量行业专家偏好模型输出的指标）得分高达70%，远超GPT-5的38%。在SWE-Bench Pro编码基准上取得55.6%，超越Claude Opus 4.5和Gemini 3 Pro。模型在长上下文推理能力上树立了新标杆，并在MRCR v2测试中实现接近100%的准确率，处理长达256k tokens。此外，幻觉错误率降低了30%，视觉理解能力在图表推理和软件界面理解任务上错误率几乎减半。尽管性能大幅提升，模型价格也比GPT-5.1上涨了40%。Altman还透露，OpenAI将在下周发布圣诞惊喜，并计划在明年第一季度推出**“成人模式”**。
OpenAI与迪士尼达成Sora内容生成里程碑式合作-Sam Altman
OpenAI与迪士尼公司签署了一项为期三年的里程碑式合作协议。通过此协议，OpenAI的Sora模型将获准使用迪士尼旗下包括皮克斯、漫威和星球大战等200多个标志性IP角色，进行AI短视频创作。OpenAI CEO Sam Altman对此次合作表示非常期待，他认为迪士尼是全球最优秀的叙事公司，用户对利用其经典角色生成内容的需求非常高。
HuggingFace HF Skills赋能AI模型自动化训练-merve
HuggingFace推出了HF Skills，这是一个允许用户使用选定的LLM自动化执行多种任务的工具库。其中的model-trainer技能能够指导LLM应用SFT、DPO、GRPO等模型训练技术，并利用HuggingFace Jobs在GPU上运行脚本，大幅简化了模型训练流程。merve还指出，已成功在视觉语言模型上测试了SFT，并计划很快将DPO和GRPO的支持扩展到视觉LMs。
Reachy Mini开放SDK、API及模拟器，鼓励社区应用开发-clem 🤗
Reachy Mini现在开放了其SDK、API和模拟器，使社区成员能够开发和分享应用程序。即使尚未拥有Reachy Mini设备，开发者也能通过这些工具进行创作。Reachy团队鼓励用户提交创意应用，并表示将在未来亲自测试并分享视频。潜在应用包括“黑珍珠号”船长等待动画、节拍器、放松应用、魔术8球、捉迷藏、面部追踪和实时翻译等，展示了该平台广泛的创新潜力。
Andrew Ng分享构建“不可靠”AI代理的aisuite开源包-Andrew Ng
吴恩达（Andrew Ng）分享了一个使用开源aisuite包构建高度自主、中等能力但**“不可靠”AI代理**的有趣方法。通过简短的代码，开发者可以为大型语言模型（LLM）配置磁盘访问或网络搜索等工具，并赋予其高层任务，例如创建贪吃蛇游戏或进行深入研究。他指出，这并非当前实用AI代理的构建方式，但为实验提供了有趣的平台。
Replit平台最新动态与社区拓展计划-Amjad Masad
Replit平台近期有多项进展。Stripe与Replit举行了炉边谈话，可能预示着合作深化。有用户反馈，Replit Fast在成本效益、准确性和鲁棒性方面优于Assistant。此外，Replit正在积极扩展其全球社区，并招聘了成员协助社区规模化。
Google DeepMind发布Gemini Deep Research Agent-Demis Hassabis
Google DeepMind发布了面向开发者的Gemini Deep Research Agent。这款AI代理具备制定研究计划、识别知识空白以及自主导航复杂信息的能力，预示着AI在自动化研究领域的应用前景。
Rnj-1-Instruct成为HuggingFace最热门文本生成模型-clem 🤗
Rnj-1-Instruct模型已迅速崛起，成为HuggingFace平台上排名第一的文本生成模型。这表明该模型在社区中受到了广泛关注和认可，可能在文本生成能力上表现出色。
李飞飞教授呼吁以人类为中心的AI发展，展望空间智能前沿-Fei-Fei Li
李飞飞教授对AI领域的快速发展表示谦逊，并强调AI是多代技术专家共同努力的成果，其根源可追溯到艾伦·图灵“机器能否思考”的根本问题。她呼吁未来AI的发展、应用和治理必须始终以人类为中心，造福全人类，并对空间智能作为AI的下一个前沿领域充满期待。
AI图像生成提示词与创作技巧分享-宝玉
推主“宝玉”分享了一系列实用的AI图像生成提示词和技巧。其中包括用于创造粘土动画风格和**“黑珍珠号”漂流瓶微缩场景**的详细描述。他还转发了关于利用Gemini Web/App（可能指Banana Pro）提升图像生成质量的9条建议，如下载最终质量图片、开启Thinking模式及指定2K分辨率。此外，还分享了制作艺术圣诞肖像和手绘皮卡丘草图的提示词，为AI艺术创作者提供了宝贵的参考。
HuggingFace的text-generation-inference库进入维护模式-clem 🤗
HuggingFace的text-generation-inference库目前已进入维护模式。未来将主要接受次要错误修复的拉取请求，表明该项目将放缓新功能开发，转而侧重于稳定性和问题修复。
AutoGLM：一个能够操作手机的AI代理模型开源发布-clem 🤗
由**@Zai_org开发的AutoGLM是一款令人惊叹的AI代理，其显著特点是能够使用手机**。该模型在MIT许可证下发布，所有代码均开源，预示着AI代理在移动设备交互方面的新突破。
Google DeepMind的Gemma模型在Nvidia H100上成功进行推理-Demis Hassabis
Starcloud-1平台已成功利用其Nvidia H100 GPU对Google DeepMind的Gemma模型进行了推理运算。这一消息显示了Gemma模型在高性能AI硬件上的部署和应用进展，以及Nvidia H100在加速前沿AI模型方面的强大能力。
Worktrace AI公司正式解除隐身模式-sarah guo
Worktrace AI公司已正式退出隐身模式（out of stealth），标志着该公司将向公众展示其产品和愿景。该消息由Sarah Guo转发，并表示她已正式重新加入职场，选择加入Worktrace AI团队，显示出对该公司前景的信心。