2025.12.02 全球AI新闻速递

今日全球AI领域动态激烈,视频生成模型的竞争进入白热化阶段,Runway发布Gen 4.5模型,在基准测试中超越谷歌及OpenAI的同类产品。与此同时,具身智能正从学术界走向产业前沿,清华大学成立专属研究院,滴滴等资本也开始布局相关交互技术。大型科技公司的战略调整同样值得关注,苹果AI部门迎来新负责人,汇丰银行等传统巨头则通过与Mistral AI合作加速内部AI应用。此外,从DeepSeek发布对标GPT-5的推理模型到Nvidia开源自动驾驶视觉模型,技术迭代的步伐丝毫未减,预示着AI正向更复杂的推理和物理世界交互深度渗透。


  1. Runway 推出 Gen 4.5 AI 视频模型,测试成功击败谷歌 Veo3、OpenAI Sora 2

    AI初创公司Runway发布其最新的视频生成模型Gen 4.5。据独立AI基准测试机构Artificial Analysis的Video Arena榜单显示,该模型表现优于谷歌的Veo 3和OpenAI的Sora 2 Pro,位居榜首。Gen 4.5能够根据文本提示生成高清视频,并精准理解运动、镜头调度及因果关系,在物理规律理解方面有显著提升。目前该模型正逐步向所有Runway用户开放。

  2. 清华大学成立具身智能与机器人研究院

    继设立具身智能系统北京市重点实验室后,清华大学正式成立具身智能与机器人研究院,旨在整合校内相关科研力量,推动该领域从“单兵作战”向“集团军协同”模式升级。此举标志着顶尖学府正加速布局具身智能这一前沿领域,以应对产业对复合型人才的迫切需求。此前,上海交通大学已率先开设全球首个具身智能四年制本科专业。

  3. DeepSeek发布新推理模型,对标GPT-5,挑战Gemini 3 Pro

    中国AI公司DeepSeek发布了两款专注于推理的新模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。据官方介绍,V3.2模型在性能上达到了GPT-5的水平,而更强大的V3.2-Speciale则旨在与Gemini-3.0-Pro相媲美。这两款模型专为智能体、工具使用和复杂推理任务设计,显示出DeepSeek在高端AI模型市场的雄心。

  4. 詹南德里亚卸任苹果 AI 战略负责人,微软前高管接棒

    苹果公司宣布,负责机器学习与AI战略的高级副总裁约翰·詹南德里亚即将退休。其职位将由微软前高管阿马尔·苏布拉马尼亚(Amar Subramanya)接替,后者将直接向软件工程高级副总裁克雷格·费德里吉汇报。此次人事变动被视为苹果调整其AI战略、意图更紧密地将AI技术集成到核心产品线中的重要信号。

  5. 快手可灵视频 O1 模型全量上线

    快手旗下的可灵AI宣布,其全球首个统一多模态视频模型——可灵视频 O1 模型已全量上线。该模型基于全新的生成式底座和MVL(多模态视觉语言)交互架构,并结合了Chain-of-thought技术,使其具备强大的常识推理和事件推演能力。用户可通过简单的对话式交互,精准控制视频内容,实现多视角、多主体的连贯画面生成。

  6. 英伟达发布专注于自动驾驶的视觉语言动作模型 Alpamayo-R1

    英伟达发布并开源了业界首个专注于自动驾驶领域的视觉语言动作模型(VLAM)——Alpamayo-R1。该模型能同时处理文本与图像信息,使车辆能够“看见”并理解周围环境,从而做出更精准的驾驶决策。Alpamayo-R1基于英伟达此前的Cosmos-Reason推理模型构建,现已在GitHub和Hugging Face平台开放给研究社区。

  7. 寻找“ChatGPT时刻”:谁能定义具身智能?

    在36氪举办的WISE2025商业之王大会上,多位嘉宾共同探讨了具身智能的未来。行业普遍认为,大模型补足了机器人的“大脑”,使它们能更好地理解和执行任务,未来的关键在于世界模型的构建。与会者认为,生产力受限或知识传递效率低的传统行业,以及更易接纳新技术的场景,将是具身智能最先实现规模化价值的领域。

  8. 滴滴投了一家机器人表情头公司丨36氪首发

    机器人多模态交互公司**「无论科技」**完成数千万元Pre-A轮融资,投资方包括滴滴战投。该公司专注于为机器人打造具备丰富表情和情感交互能力的头面部组件,其产品搭载了多模态大模型和自研的情感生成小模型。此轮融资将用于标准化产品的完善和情感交互模型的迭代,目标是在2026年实现规模化出货。

  9. 汇丰银行与 Mistral AI 建立战略合作伙伴关系,导入后者商用模型

    全球银行业巨头汇丰银行宣布与欧洲AI独角兽Mistral AI达成战略合作。汇丰将在其内部算力基础设施上,自托管运行Mistral的商用大模型,以开发覆盖全机构的GenAI解决方案。此举旨在利用AI加强财务分析、优化客户流程、提升多语言信息处理能力,并缩短内部创新周期。

  10. ChatGPT 用户报告首次发现广告

    有用户报告称,在与ChatGPT的实时对话中首次看到了广告内容。据描述,当对话提及特定话题时,界面中出现了一张不相关的促销卡片,例如在讨论播客时出现了健身品牌的广告。这表明OpenAI可能正在测试其产品的商业化路径,探索在不严重影响用户体验的前提下实现流量变现。

  11. Google 的下一个“注意力就是你所需要的”时刻

    Google Research发表了一篇新论文,提出了一个名为**嵌套学习(Nested Learning, NL)**的新框架,旨在重新定义对神经网络如何存储和学习信息的理解。研究人员认为,当前将神经网络视为层级堆叠的观点并不完整,而应将其看作多个拥有内部记忆的优化过程的集合。该理论试图解释当前AI模型的局限性,并为构建更强大的未来模型提供理论基础。

  12. 飞书深诺集团创始人兼CEO沈晨岗:营销+AI双轮驱动,中国企业全球征程加速度

    飞书深诺集团创始人沈晨岗指出,AI正在重构营销价值链,成为驱动中国企业全球化的核心动力。AI不仅革新了创意内容的生产方式,还能高效地收集和管理数据,从而革命性地提升营销效果的衡量精度和决策质量。他认为,营销范式正从单点优化转向由系统性归因带动的全局提升,AI与数字基建的结合将是下一轮全球化竞争的关键。


点评

今天的消息很有意思,表面上看是各个赛道的点状突破,但背后其实是同一条主线的两个不同阶段。

一边是“军备竞赛”的持续升级。从Runway的Gen 4.5到DeepSeek的V3.2,模型性能的比拼已经从参数量、基准分卷到了对物理世界和复杂逻辑的理解深度上。这不再是单纯的算法游戏,而是数据、算力和工程能力的综合较量。Nvidia开源自动驾驶模型,更是把这种竞赛引向了最考验安全性和可靠性的垂直领域。这说明,基础模型的“天花板”还远未到顶,大家还在疯狂往上拱火

另一边,则是“价值落地”的焦虑和探索。苹果换帅、汇丰拥抱Mistral,说明巨头们已经意识到,模型再好,不能融入业务、变成产品就是空中楼阁。而清华成立研究院、滴滴投资机器人表情,则是在为更遥远的“具身智能”时代铺路。他们很清楚,当数字世界的智能趋于饱和,物理世界的交互能力将是下一个核心壁垒。最有意思的是ChatGPT试水广告,这标志着一个时代的结束:靠烧钱换用户的野蛮生长期过去了,现在必须回答最根本的商业问题——如何赚钱。

总的来看,AI行业正在从“造神”阶段,快速进入“驯神”和“用神”的阶段。前者比拼的是技术上限,后者考验的是工程落地、产品定义和商业闭环的能力。对于我们做技术的人来说,这意味着机会和挑战并存:既要抬头看路,跟上模型迭代的速度;也要低头拉车,思考如何将这些强大的“锤子”用在正确的“钉子”上,解决实际问题。未来几年,真正能跑出来的,一定是那些能在这两者之间找到最佳平衡点的团队。