2025.09.23 全球AI新闻速递

今日全球AI领域的核心焦点是算力基础设施的军备竞赛。英伟达与OpenAI的千亿美元合作计划,旨在构建前所未有的10GW级别AI数据中心,这不仅是资本的豪赌,更是将算力定义为未来经济核心的明确信号。与此同时,苹果正通过操作系统层面的整合(如MCP协议),意图成为AI能力的“调度中心”,掌控终端入口。在模型层面,GPT-5的评测细节揭示了顶尖模型在解决复杂任务时的真实瓶颈,而百度、DeepSeek等则在垂直应用和模型优化上持续发力,显示出AI技术从通用能力向产业落地纵深发展的清晰趋势。


  1. 英伟达与OpenAI达成千亿美元战略合作,共建10GW超级AI数据中心

    英伟达和OpenAI宣布建立战略合作伙伴关系,计划利用数百万块英伟达GPU,为OpenAI打造和部署至少10GW的AI数据中心,以训练和部署其下一代模型,推动通用人工智能(AGI)的发展。英伟达承诺,随着每吉瓦(GW)的部署,将逐步向OpenAI投资最高1000亿美元。项目首阶段预计于2026年下半年上线,基于英伟达Rubin平台。黄仁勋指出,10GW算力相当于400万至500万块GPU,几乎是英伟达今年的全部出货量。

  2. GPT-5编程能力评测反转:未提交任务过多,实际解决率远超对手

    在Scale AI最新的软件工程基准测试SWE-BENCH PRO中,GPT-5的表面成绩(23.3%)略高于Claude Opus 4.1(22.7%)。然而,深入分析发现,GPT-5有高达63.1%的任务未提交解决方案。若仅计算已提交任务的准确率,GPT-5的准确率高达63%,是Claude Opus 4.1(31%)的两倍以上。这表明GPT-5在理解和解决复杂编程问题上具有强大潜力,但其在工具使用或任务提交流程的有效性上可能存在短板。

  3. 苹果加速AI生态整合:为iOS 26引入MCP协议,实现跨平台AI交互

    苹果在最新的iOS 26.1等开发者测试版中,初步整合了Anthropic提出的MCP(模型上下文协议)。该协议被视为AI领域的HTTP,旨在统一AI系统访问和操作数据源的方式。一旦支持成熟,开发者将能让ChatGPT、Claude等支持MCP的AI模型直接与iPhone、iPad上的应用进行交互,执行跨应用操作。此举被看作是苹果推动AI深度融入其生态系统的关键一步,未来有望极大提升设备的自动化和智能化水平。

  4. 奥尔特曼预告ChatGPT新产品:计算密集型,Pro会员也需额外付费

    OpenAI CEO萨姆·奥尔特曼预告,未来几周将推出一款计算密集型的新产品,该产品将对算力进行不计成本的投入。该功能将仅限于Pro订阅用户,并且部分功能可能还需要在此基础上额外付费。此举与其庞大的算力投资计划相呼应,OpenAI计划未来五年额外支出约1000亿美元租用服务器,并预计到2030年年收入将突破2000亿美元。

  5. 苹果AI生图应用“图乐园”将转型为模型“聚合器”

    苹果计划为旗下AI生图应用“图乐园”(Image Playground)引入新的框架,为接入更多第三方模型做准备。最新测试版代码显示,新增了“估算延迟”和提供商标示等功能,旨在评估和区分不同模型的性能。此举意味着“图乐园”将从依赖苹果自研模型的单一应用,转变为一个可以调用多个AI模型的聚合平台,此前已引入OpenAI的ChatGPT,未来可能接入谷歌Gemini等更多模型。

  6. 百度智能云开源视觉理解模型Qianfan-VL,基于自研昆仑芯芯片

    百度智能云千帆正式推出并全面开源其全新视觉理解模型Qianfan-VL。该系列模型包含3B、8B和70B三种尺寸,专为企业级多模态应用场景深度优化,在OCR、文档理解和教育等垂直领域进行了专项强化。值得注意的是,该模型的训练和推理基于百度自研的昆仑芯P800芯片,展示了百度在AI硬件与软件协同发展的全栈能力。

  7. DeepSeek线上模型升级至V3.1-Terminus,优化Agent能力

    DeepSeek宣布其线上模型已升级至V3.1-Terminus版本。新版本在保持原有性能的基础上,重点改进了语言一致性,缓解了中英文混杂和异常字符问题。同时,进一步优化了Code AgentSearch Agent的表现,提升了模型作为智能体的任务执行能力。新模型提供思考和非思考两种模式,上下文长度均为128k。

  8. 东风汽车与华为成立联合创新实验室,聚焦智能驾驶与AI应用

    东风汽车与华为的联合创新实验室正式揭牌。双方将重点围绕车载软件研发平台、辅助智能驾驶、AI泛场景应用以及具身智能等前沿领域加强合作。此次合作标志着传统车企与科技巨头在智能汽车领域的深度绑定,旨在加速AI技术在汽车产业的研发与落地。

  9. 谷歌Chrome浏览器“朗读”功能升级,可生成播客式AI音频摘要

    安卓版Chrome浏览器的“朗读”功能获得AI驱动的重大升级。现在,该功能不再是简单地逐字朗读网页,而是能利用AI生成内容的**“音频摘要”**,并以两位AI主持人对话的播客形式呈现。这一创新旨在将静态的文本内容转化为更具互动性和吸引力的听觉体验,提升用户获取信息的效率和趣味性。

  10. OpenAI Sora的训练数据引发版权争议

    OpenAI的文生视频模型Sora因其生成内容的风格与Netflix、TikTok等平台上的受版权保护作品高度相似,引发了关于其训练数据来源的版权风暴。测试表明,Sora可能在未经许可的情况下,使用了大量来自流媒体平台和社交媒体的版权内容进行训练。这一问题再次将AI开发的“合理使用”边界推向风口浪尖,相关法律和伦理的辩论正愈演愈烈。


点评

今天的新闻很有意思,展现了AI赛道的两个极端:一端是暴力美学,另一端是精耕细作

OpenAI和英伟达的千亿美金合作,本质上是在用建核电站的逻辑来搞AI。他们不再谈论某个算法的精巧,而是直接把**“吉瓦”(GW)**这个能源单位搬到了算力场上。这背后是一种认知上的范式转移:未来的通用人工智能,其核心壁垒不是模型本身,而是能够持续供给天量算力的“能源基础设施”。这盘棋,已经不是单纯的技术竞赛,而是资本、能源和地缘政治的综合国力较量。

另一端,苹果的做法则完全不同。它不急于自建“核电站”,而是致力于打造覆盖全球的“智能电网”。通过在操作系统层面植入MCP这类协议,苹果试图定义AI Agent与应用交互的标准,成为所有AI能力的最终分发和调度者。它的核心逻辑是,无论上游的模型如何迭代,最终触达用户的最后一公里,必须经过苹果的生态系统。这是一种更聪明、也更符合其平台基因的打法。

至于GPT-5的评测结果,更是揭示了一个工程现实:再聪明的“大脑”,如果“手脚”不协调(工具调用失败),也无法完成复杂任务。这说明顶尖模型的竞争,已经从单纯比拼智商(IQ)进入到了比拼执行可靠性系统工程能力的阶段。这对于我们这些做工程和产品的人来说,其实是更大的机会所在。浮夸的参数竞赛正在退潮,真正能稳定解决问题的系统,价值会越来越凸显。