2025.12.12.04 过去4小时全球AI发生了什么?
OpenAI 发布 GPT-5.2,智能与效率再创新高 - Sam Altman
Sam Altman 宣布 GPT-5.2 已正式上线,可通过 ChatGPT 及 API 访问。该模型被誉为全球最智能的通用模型,尤其在处理实际知识工作任务上表现出色。GPT-5.2在GDPval指标上获得了70%的专家偏好率,远超GPT-5的38%。同时,模型在SWE-Bench Pro、ARC-AGI-2和Frontier Math等多个基准测试中表现强劲,并且在一年内实现了390倍的成本降低。Sam Altman表示,即使不考虑新的文件输出功能,GPT-5.2也是一次意义重大的升级,并预告下周将发布更多“圣诞惊喜”。
迪士尼与OpenAI达成三年期IP授权协议,Sora将创作IP短视频 - 宝玉 (转自 小互)
迪士尼公司与OpenAI正式签署了一项为期三年的里程碑式合作协议。根据此协议,OpenAI的Sora模型将获准使用迪士尼旗下200多个标志性IP角色,涵盖迪士尼、皮克斯、漫威和星球大战等品牌,进行AI短视频创作。这项合作将极大丰富AI生成视频的内容库,标志着AI技术与全球顶级娱乐IP深度结合的新阶段。
吴恩达分享构建高度自主但“不可靠”AI代理的实验经验 - Andrew Ng
人工智能领军人物吴恩达分享了利用开源aisuite软件包构建高度自主、具备一定能力但“非常不可靠”的AI代理的有趣实验。通过几行代码,可为前沿LLM提供工具(如磁盘访问、网络搜索),并分配高层任务(如创建贪吃蛇游戏、深度研究),以观察其自主行为。吴恩达强调,虽然这不是当前实用AI代理的构建方式,因实际应用需更多结构化支持,但这种实验对于理解和探索AI代理能力边界具有重要意义。
Hugging Face生态系统:模型训练与热门文本生成模型进展 - merve / clem 🤗
Hugging Face生态系统持续发展,merve 分享了DPO(Direct Preference Optimization)在模型训练中的有效性,并成功将SFT(监督微调)应用于视觉语言模型(VLM)的测试,未来还将对VLM的DPO和GRPO进行测试。她还介绍了HF Skills,这是一个利用LLM自动执行SFT、DPO、GRPO等模型训练任务的工具库,通过Hugging Face Jobs在GPU上运行,大幅简化了训练流程。此外,clem 🤗 转推消息指出Rnj-1-Instruct已成为Hugging Face上最受欢迎的文本生成模型。
Replit举行炉边谈话,Replit Fast在成本效益与性能上获认可 - Amjad Masad
Replit 首席执行官 Amjad Masad 分享了Stripe与Replit的炉边谈话活动。同时,有用户反馈表示,Replit Fast在成本效益、准确性和鲁棒性方面表现出色,优于现有的Assistant模型。这表明Replit在提供高效且经济的AI辅助开发工具方面取得了进展,正积极探索AI在编程领域的应用潜力。
Reachy迷你机器人发布SDK、API与模拟器,赋能社区应用开发 - clem 🤗
clem 🤗 宣布推出了Reachy迷你机器人的SDK、API和模拟器,旨在鼓励全球开发者社区为其开发并分享创新应用。他承诺将亲自测试社区提交的简单应用,并分享视频,为早期开发者提供曝光机会。Reachy迷你可实现多种功能,包括播放音乐、跳舞、作为节拍器、魔术8号球、捉迷藏、面部追踪、物体识别、房间描述以及实时翻译等,展示了其广泛的应用场景和潜力。
李飞飞强调AI应以人为本,展望空间智能为未来前沿 - Fei-Fei Li
斯坦福大学教授李飞飞(Fei-Fei Li)对AI技术的快速发展表达了惊喜与谦逊。她强调,AI是历代技术人员智慧的结晶,其发展和应用应始终秉持以人为本的原则,以造福全人类。同时,李飞飞对AI的下一个前沿——空间智能——充满期待,认为这将是AI未来发展的关键方向。
多位创作者分享了关于AI图像生成和提示词(Prompt)创作的实用经验。宝玉展示了使用“nano banana pro”模型生成的漂流瓶中黑珍珠号的精细照片级图像,并提供了中英文详细提示词。此外,还有分享了使用Gemini Web/App获取高品质图像的9个技巧,包括下载高品质图片和开启“Thinking”模式。这些内容突出了高质量提示词在AI艺术创作中的核心作用,以及通过巧妙设计提示词实现特定视觉风格和细节控制的能力。