2025.12.12.04 过去4小时全球AI发生了什么？

Dec 12, 2025 · 1 分钟阅读 ·

分享到:

OpenAI 发布 GPT-5.2，智能与效率再创新高 - Sam Altman
Sam Altman 宣布 GPT-5.2 已正式上线，可通过 ChatGPT 及 API 访问。该模型被誉为全球最智能的通用模型，尤其在处理实际知识工作任务上表现出色。GPT-5.2在GDPval指标上获得了70%的专家偏好率，远超GPT-5的38%。同时，模型在SWE-Bench Pro、ARC-AGI-2和Frontier Math等多个基准测试中表现强劲，并且在一年内实现了390倍的成本降低。Sam Altman表示，即使不考虑新的文件输出功能，GPT-5.2也是一次意义重大的升级，并预告下周将发布更多“圣诞惊喜”。
迪士尼与OpenAI达成三年期IP授权协议，Sora将创作IP短视频 - 宝玉 (转自小互)
迪士尼公司与OpenAI正式签署了一项为期三年的里程碑式合作协议。根据此协议，OpenAI的Sora模型将获准使用迪士尼旗下200多个标志性IP角色，涵盖迪士尼、皮克斯、漫威和星球大战等品牌，进行AI短视频创作。这项合作将极大丰富AI生成视频的内容库，标志着AI技术与全球顶级娱乐IP深度结合的新阶段。
吴恩达分享构建高度自主但“不可靠”AI代理的实验经验 - Andrew Ng
人工智能领军人物吴恩达分享了利用开源aisuite软件包构建高度自主、具备一定能力但“非常不可靠”的AI代理的有趣实验。通过几行代码，可为前沿LLM提供工具（如磁盘访问、网络搜索），并分配高层任务（如创建贪吃蛇游戏、深度研究），以观察其自主行为。吴恩达强调，虽然这不是当前实用AI代理的构建方式，因实际应用需更多结构化支持，但这种实验对于理解和探索AI代理能力边界具有重要意义。
Hugging Face生态系统：模型训练与热门文本生成模型进展 - merve / clem 🤗
Hugging Face生态系统持续发展，merve 分享了DPO（Direct Preference Optimization）在模型训练中的有效性，并成功将SFT（监督微调）应用于视觉语言模型（VLM）的测试，未来还将对VLM的DPO和GRPO进行测试。她还介绍了HF Skills，这是一个利用LLM自动执行SFT、DPO、GRPO等模型训练任务的工具库，通过Hugging Face Jobs在GPU上运行，大幅简化了训练流程。此外，clem 🤗 转推消息指出Rnj-1-Instruct已成为Hugging Face上最受欢迎的文本生成模型。
Replit举行炉边谈话，Replit Fast在成本效益与性能上获认可 - Amjad Masad
Replit 首席执行官 Amjad Masad 分享了Stripe与Replit的炉边谈话活动。同时，有用户反馈表示，Replit Fast在成本效益、准确性和鲁棒性方面表现出色，优于现有的Assistant模型。这表明Replit在提供高效且经济的AI辅助开发工具方面取得了进展，正积极探索AI在编程领域的应用潜力。
Reachy迷你机器人发布SDK、API与模拟器，赋能社区应用开发 - clem 🤗
clem 🤗 宣布推出了Reachy迷你机器人的SDK、API和模拟器，旨在鼓励全球开发者社区为其开发并分享创新应用。他承诺将亲自测试社区提交的简单应用，并分享视频，为早期开发者提供曝光机会。Reachy迷你可实现多种功能，包括播放音乐、跳舞、作为节拍器、魔术8号球、捉迷藏、面部追踪、物体识别、房间描述以及实时翻译等，展示了其广泛的应用场景和潜力。
李飞飞强调AI应以人为本，展望空间智能为未来前沿 - Fei-Fei Li
斯坦福大学教授李飞飞（Fei-Fei Li）对AI技术的快速发展表达了惊喜与谦逊。她强调，AI是历代技术人员智慧的结晶，其发展和应用应始终秉持以人为本的原则，以造福全人类。同时，李飞飞对AI的下一个前沿——空间智能——充满期待，认为这将是AI未来发展的关键方向。
AI图像生成提示词技巧分享：从微缩景观到创意人像 - 宝玉
多位创作者分享了关于AI图像生成和提示词（Prompt）创作的实用经验。宝玉展示了使用“nano banana pro”模型生成的漂流瓶中黑珍珠号的精细照片级图像，并提供了中英文详细提示词。此外，还有分享了使用Gemini Web/App获取高品质图像的9个技巧，包括下载高品质图片和开启“Thinking”模式。这些内容突出了高质量提示词在AI艺术创作中的核心作用，以及通过巧妙设计提示词实现特定视觉风格和细节控制的能力。