2025.09.30 全球AI新闻速递
今日全球AI领域风起云涌,竞争焦点已从单纯的模型参数竞赛转向生态系统与应用场景的深度整合。Anthropic发布号称“最强编程模型”的Claude Sonnet 4.5,直指开发者与企业级自动化;而OpenAI则双线出击,不仅计划推出全AI生成内容的“AI版TikTok”,更将ChatGPT打造为电商支付一体机,意图构建从内容到交易的闭环。微软紧随其后,将Agent理念深度植入Office套件。国内方面,DeepSeek新模型发布即获硬件生态支持,华为盘古模型持续精进,展现出快速追赶与生态协同的决心。
Anthropic 发布 Claude Sonnet 4.5,号称“全球最佳编程AI模型”
Anthropic公司发布了其最新AI模型 Claude Sonnet 4.5,在多个编程基准测试(如SWE-bench)中取得业界领先成绩。该模型的核心突破在于其强大的代理能力和持久的任务专注力,据称能在无人干预的情况下,连续工作超过30小时来完成复杂的、多步骤的软件开发任务,如搭建数据库服务、购买域名等。Anthropic称其为“世界上最好的编程模型”,旨在将AI从一个辅助工具转变为能够独立交付生产级应用的“同事”。公司同步推出了相关的开发者工具,进一步强化其在AI代理和自动化编程领域的布局。
OpenAI 被曝将推出“AI版TikTok”,所有短视频均由AI生成
据报道,OpenAI正计划推出一款独立的社交应用,其模式类似TikTok,但所有内容均由其视频生成模型 Sora 2 实时生成。用户将无法上传本地视频,只能通过滑动浏览AI创作的竖屏短视频。该应用生成的视频长度不超过10秒,并提供身份验证功能,允许用户授权Sora 2使用自己的肖像进行创作。此举标志着OpenAI正式进军内容消费领域,但也引发了关于AI内容版权的激烈讨论,其“版权方主动退出”的策略可能会面临法律和伦理挑战。
微软正加速将AI智能体(Agent)集成到Microsoft 365 Copilot中,推出所谓的“氛围工作”(Vibe Working)理念。新功能包括在Excel和Word中的Agent Mode,以及在Copilot聊天中的Office Agent。用户只需通过简单的自然语言提示,AI就能自主完成制表、数据分析、文档起草与排版、制作PPT等复杂任务,并通过迭代对话进行完善。值得注意的是,这些功能混合使用了OpenAI和Anthropic的先进模型,旨在将Office从工具软件转变为一个智能化的工作伙伴。
OpenAI推出“即时结账”功能,ChatGPT变身购物支付一体机
OpenAI为ChatGPT新增了“即时结账”功能,允许用户直接在对话界面内完成商品购买,首批支持Etsy和Shopify平台。此功能由OpenAI与Stripe共同开发的开源“智能体电商协议”(ACP)驱动,旨在让AI代理能够安全地处理交易,无缝连接商户后端和支付系统。这一举措标志着ChatGPT从信息获取工具向行动执行智能体的重大转变,意图在未来的AI电商生态中扮演核心角色,构建从需求理解到交易完成的完整闭环。
DeepSeek-V3.2-Exp模型发布并开源,寒武纪同步完成适配
深度求索(DeepSeek)正式发布并开源了其最新的DeepSeek-V3.2-Exp大模型,并大幅降低了API价格。该模型引入了创新的稀疏注意力机制,能显著降低长序列场景下的训练和推理成本。几乎在同一时间,国产AI芯片厂商寒武纪宣布已完成对该模型的适配,并开源了其推理引擎vLLM-MLU。这种模型发布与硬件生态支持的紧密联动,展示了国内AI产业链上下游协同的加速趋势,旨在为市场提供更具竞争力的软硬件一体化解决方案。
旷视科技创始人印奇创办的千里科技正全力押注智能驾驶领域,计划今年实现百亿产值。公司的核心战略是采用以大模型驱动的纯视觉方案,并构建一个从L2+到L4级的统一技术框架,以共享研发成本和数据。印奇认为这是智能驾驶的终极方案。千里科技已获得奔驰的投资,其业务覆盖智能驾驶、智能座舱和Robotaxi。此举反映出AI领域的资深玩家正在将大模型技术应用于对数据和工程化要求极高的垂直领域,试图在智能汽车行业开辟新的增长曲线。
在最新的SuperCLUE中文大模型通用基准测评中,华为盘古718B模型在开源模型中排名第二。openPangu团队详细介绍了其在数据构建、训练方法和微调方案上的技术细节。为缓解AI幻觉问题,团队引入了“批判内化”机制,引导模型在生成时主动审视推理过程。同时,通过升级版的工具合成框架ToolACE,提升了模型的多工具调用能力。这显示了华为在基础模型研发上的持续投入和技术创新,尤其是在提升模型可靠性和实用性方面的深入探索。
音乐流媒体巨头Spotify在过去一年中下架了高达7500万首被认定为“垃圾”的歌曲,其中大部分由AI生成。这些内容并非创意实验,而是旨在利用平台支付系统的算法产物,例如通过上传大量背景噪音填充播放列表来骗取播放分成。这一大规模清理行动凸显了生成式AI带来的新挑战:当内容生成成本趋近于零,平台必须投入巨大资源来区分创造性艺术与操纵性垃圾信息,这预示着未来平台治理将面临一场与AI滥用之间持续的“军备竞赛”。
点评
今天的几条新闻,串起来看非常有意思。表面上是OpenAI、Anthropic和微软之间的神仙打架,但底下暗流涌动的是一场关于AI价值闭环的深刻变革。
过去大家比拼的是模型参数、是基准分数,这本质上还是“炼丹”的思路,是把模型本身当作产品。现在,战局已经悄然转移。你看OpenAI,一边用Sora搞内容平台,一边用Agent搞电商支付,它不再满足于只做那个最聪明的“大脑”,它要做的是连接信息、决策到最终行动的完整神经系统。这才是Agent的真正威力所在,也是商业化的终极形态。
Anthropic的Claude 4.5,看似专注在“编程”这个垂直领域,实则也是在构筑同样的闭环。能独立工作30小时的AI,已经不是简单的代码补全工具,而是数字化的劳动力。它瞄准的是企业研发流程的自动化,价值链条极深。
再看国内,DeepSeek模型一发布,寒武纪马上跟进适配。这说明我们已经意识到了,光有算法模型是空中楼阁,软硬件协同的生态才是真正的护城河。千里科技用大模型重构智驾技术栈,也是同样的逻辑——把最前沿的AI技术,应用到最复杂、最有价值的工业场景里去。
所以,不要再只盯着哪个模型的参数又多了几千亿。真正的看点在于,谁能最快地将这些聪明的“大脑”武装到具体的业务场景中,构建起从数据输入到价值输出的自动化飞轮。这场竞赛已经从百米冲刺,变成了考验耐力、战略和执行力的马拉松。模型即服务(MaaS)的时代正在过去,**模型即应用(MaaS - Model as an Application/Agent)**的时代,才刚刚拉开序幕。