2025.12.12.12 过去4小时全球AI发生了什么?
以下是过去4小时全球AI领域的重要动态:
OpenAI正式发布GPT-5.2模型,性能大幅提升并调整定价-Sam Altman
OpenAI现已通过ChatGPT和API正式发布GPT-5.2模型,Sam Altman称其为目前最智能的通用模型,尤其擅长处理实际工作任务。GPT-5.2在性能上实现了显著飞跃,GDPval指标(衡量行业专家偏好模型输出的指标)得分高达70%,远超GPT-5的38%。在SWE-Bench Pro编码基准上取得55.6%,超越Claude Opus 4.5和Gemini 3 Pro。模型在长上下文推理能力上树立了新标杆,并在MRCR v2测试中实现接近100%的准确率,处理长达256k tokens。此外,幻觉错误率降低了30%,视觉理解能力在图表推理和软件界面理解任务上错误率几乎减半。尽管性能大幅提升,模型价格也比GPT-5.1上涨了40%。Altman还透露,OpenAI将在下周发布圣诞惊喜,并计划在明年第一季度推出**“成人模式”**。
OpenAI与迪士尼达成Sora内容生成里程碑式合作-Sam Altman
OpenAI与迪士尼公司签署了一项为期三年的里程碑式合作协议。通过此协议,OpenAI的Sora模型将获准使用迪士尼旗下包括皮克斯、漫威和星球大战等200多个标志性IP角色,进行AI短视频创作。OpenAI CEO Sam Altman对此次合作表示非常期待,他认为迪士尼是全球最优秀的叙事公司,用户对利用其经典角色生成内容的需求非常高。
HuggingFace HF Skills赋能AI模型自动化训练-merve
HuggingFace推出了HF Skills,这是一个允许用户使用选定的LLM自动化执行多种任务的工具库。其中的
model-trainer技能能够指导LLM应用SFT、DPO、GRPO等模型训练技术,并利用HuggingFace Jobs在GPU上运行脚本,大幅简化了模型训练流程。merve还指出,已成功在视觉语言模型上测试了SFT,并计划很快将DPO和GRPO的支持扩展到视觉LMs。Reachy Mini开放SDK、API及模拟器,鼓励社区应用开发-clem 🤗
Reachy Mini现在开放了其SDK、API和模拟器,使社区成员能够开发和分享应用程序。即使尚未拥有Reachy Mini设备,开发者也能通过这些工具进行创作。Reachy团队鼓励用户提交创意应用,并表示将在未来亲自测试并分享视频。潜在应用包括“黑珍珠号”船长等待动画、节拍器、放松应用、魔术8球、捉迷藏、面部追踪和实时翻译等,展示了该平台广泛的创新潜力。
Andrew Ng分享构建“不可靠”AI代理的aisuite开源包-Andrew Ng
吴恩达(Andrew Ng)分享了一个使用开源aisuite包构建高度自主、中等能力但**“不可靠”AI代理**的有趣方法。通过简短的代码,开发者可以为大型语言模型(LLM)配置磁盘访问或网络搜索等工具,并赋予其高层任务,例如创建贪吃蛇游戏或进行深入研究。他指出,这并非当前实用AI代理的构建方式,但为实验提供了有趣的平台。
Replit平台最新动态与社区拓展计划-Amjad Masad
Replit平台近期有多项进展。Stripe与Replit举行了炉边谈话,可能预示着合作深化。有用户反馈,Replit Fast在成本效益、准确性和鲁棒性方面优于Assistant。此外,Replit正在积极扩展其全球社区,并招聘了成员协助社区规模化。
Google DeepMind发布Gemini Deep Research Agent-Demis Hassabis
Google DeepMind发布了面向开发者的Gemini Deep Research Agent。这款AI代理具备制定研究计划、识别知识空白以及自主导航复杂信息的能力,预示着AI在自动化研究领域的应用前景。
Rnj-1-Instruct成为HuggingFace最热门文本生成模型-clem 🤗
Rnj-1-Instruct模型已迅速崛起,成为HuggingFace平台上排名第一的文本生成模型。这表明该模型在社区中受到了广泛关注和认可,可能在文本生成能力上表现出色。
李飞飞教授呼吁以人类为中心的AI发展,展望空间智能前沿-Fei-Fei Li
李飞飞教授对AI领域的快速发展表示谦逊,并强调AI是多代技术专家共同努力的成果,其根源可追溯到艾伦·图灵“机器能否思考”的根本问题。她呼吁未来AI的发展、应用和治理必须始终以人类为中心,造福全人类,并对空间智能作为AI的下一个前沿领域充满期待。
推主“宝玉”分享了一系列实用的AI图像生成提示词和技巧。其中包括用于创造粘土动画风格和**“黑珍珠号”漂流瓶微缩场景**的详细描述。他还转发了关于利用Gemini Web/App(可能指Banana Pro)提升图像生成质量的9条建议,如下载最终质量图片、开启Thinking模式及指定2K分辨率。此外,还分享了制作艺术圣诞肖像和手绘皮卡丘草图的提示词,为AI艺术创作者提供了宝贵的参考。
HuggingFace的text-generation-inference库进入维护模式-clem 🤗
HuggingFace的
text-generation-inference库目前已进入维护模式。未来将主要接受次要错误修复的拉取请求,表明该项目将放缓新功能开发,转而侧重于稳定性和问题修复。AutoGLM:一个能够操作手机的AI代理模型开源发布-clem 🤗
由**@Zai_org开发的AutoGLM是一款令人惊叹的AI代理,其显著特点是能够使用手机**。该模型在MIT许可证下发布,所有代码均开源,预示着AI代理在移动设备交互方面的新突破。
Google DeepMind的Gemma模型在Nvidia H100上成功进行推理-Demis Hassabis
Starcloud-1平台已成功利用其Nvidia H100 GPU对Google DeepMind的Gemma模型进行了推理运算。这一消息显示了Gemma模型在高性能AI硬件上的部署和应用进展,以及Nvidia H100在加速前沿AI模型方面的强大能力。
Worktrace AI公司正式解除隐身模式-sarah guo
Worktrace AI公司已正式退出隐身模式(out of stealth),标志着该公司将向公众展示其产品和愿景。该消息由Sarah Guo转发,并表示她已正式重新加入职场,选择加入Worktrace AI团队,显示出对该公司前景的信心。