2025.09.17 全球AI新闻速递
今日AI领域呈现出深度集成与应用落地两大趋势。开发者工具成为新战场,OpenAI的GPT-5-Codex与Anthropic的Claude全面融入主流IDE,预示着软件工程范式的变革。具身智能持续火热,Figure AI获巨额融资,而国内的导盲犬、空翻机器人展示了其在特定场景的突破。在消费端,苹果正式推送Apple Intelligence,将AI无缝嵌入操作系统,提升用户体验。同时,AI正深入垂直行业,从加速材料科学研究到赋能生物回收,展现出解决复杂问题的巨大潜力。Mira Murati对LLM确定性的探索和谷歌为AI代理支付制定的新标准,则从底层技术和生态规则上推动行业走向成熟。
OpenAI 推出 GPT-5-Codex,扩展 Codex 在开发者工具中的集成
OpenAI发布了专为软件工程任务优化的GPT-5-Codex模型,并对其Codex平台进行重大更新。新模型在代码重构任务上的准确率达到51.3%,显著优于标准版GPT-5的33.9%。Codex现已深度集成到终端、VS Code等IDE及GitHub中,开发者可通过
@codex review直接在Pull Request中调用代码审查。OpenAI内部已广泛部署该工具,每天能发现数百个问题。此举旨在将AI能力无缝嵌入开发全流程,提升工程效率和代码质量,并默认在沙盒环境中运行以保障安全。Anthropic宣布其AI模型Claude Sonnet 4已全面集成到苹果的开发环境Xcode 26中。开发者可将Claude账户连接至Xcode,通过自然语言与代码进行交互,实现调试、重构和新功能开发。该集成能自动从项目中获取上下文,并提供生成文档、解释代码片段、创建SwiftUI预览等工具。这一举措标志着主流AI助手正加速渗透核心开发工作流,与OpenAI的Codex在开发者生态中展开直接竞争。
Apple 今天推出了“Apple Intelligence”——实时翻译、屏幕智能和基于手表的教练功能已在您的设备上推出
苹果公司今日起正式向iPhone、iPad、Mac等设备推送Apple Intelligence系列功能。此次更新的核心是系统级的AI能力,包括在信息、电话和FaceTime中的实时翻译,以及全新的“视觉智能”功能。苹果强调通过设备端处理和“私有云计算”保障用户隐私。此外,watchOS 26引入了名为“Workout Buddy”的AI教练,能根据用户健身记录进行实时语音指导。这标志着苹果将AI能力无缝融入用户日常操作流程,而非提供一个独立的聊天机器人。
苹果 iOS 26 解锁 Siri 五项新技能:上下文感知更懂你、执行力更强
在最新的iOS 26系统中,Siri获得了五项关键能力升级。凭借更强的设备与上下文感知能力,Siri能提供更精准的回答。其与ChatGPT的集成也得到强化,不仅能保留复制内容的富文本格式,还支持直接指令ChatGPT生成文件,并对生成结果执行后续操作。此外,Siri对HomePod等多房间音频设备的控制也变得更加灵活。这些更新进一步巩固了Siri作为Apple Intelligence核心交互入口的地位。
人形机器人初创公司 Figure AI 获超 10 亿美元承诺资本,估值飙升至 390 亿美元
人形机器人领域的明星初创公司Figure AI在新一轮融资中获得超过10亿美元的承诺资本,公司估值达到390亿美元。本轮融资由现有投资者帕克维风险投资公司领投,英伟达、英特尔、高通的企业风险投资部门以及Salesforce等巨头均参与其中。Figure AI成立于2022年,致力于打造能够像人类一样推理和学习的“通用功能”人形机器人,此次巨额融资凸显了资本市场对通用具身智能赛道的高度看好。
中国移动“灵犀”电子导盲犬发布,可主动导航、避障,AI 大模型对话交流
中国移动发布了名为“灵犀”的电子导盲犬具身智能产品。该产品融合激光雷达与视觉技术,可构建高精度地图,实现主动导航和动态避障。它通过物理导盲杖和骨传导耳机与视障用户交互。其视觉识别能力可识别物体与文字,适应商超、车站等多种生活场景。此外,“灵犀”内置了中国移动自家的“九天”大模型,具备流畅的自然语言对话能力,为视障群体的出行和生活提供了新的AI解决方案。
真男人必会韦伯斯特:智元灵犀 X2 成为全球首个丝滑完成韦伯斯特动作的机器人
智元机器人公司宣布,其研发的智元灵犀 X2机器人成功完成了“韦伯斯特”空翻动作,成为全球首个实现该高难度动作的机器人。视频展示了机器人流畅连贯的空翻过程,这不仅是对其硬件性能的考验,更体现了其在运动控制、平衡算法和全身协调性方面的重大技术突破,是具身智能领域在复杂动力学控制上的一大进展。
Mira Murati的Thinking Machines解决了LLM非确定性之谜
OpenAI前CTO Mira Murati的新公司Thinking Machines宣布,已解决大型语言模型(LLM)的一大核心难题:非确定性输出。通过为关键操作创建批量不变内核,其技术能确保在温度参数为零时,模型对相同输入始终产生完全相同的输出。这一突破对于AI在科研、审计以及安全攸关领域的应用至关重要,极大地提升了模型结果的可重复性和可信度,可能将重新定义行业对确定性AI的标准。
研究人员公布了一款名为“高维物体表示张量”(THOR)的AI框架,成功解决了物理学中一项极具挑战性的“位形积分”计算问题。该框架采用张量网络方法,将原本需要超级计算机数周的运算时间大大缩短。这一突破使得科学家能更快速、精准地预测金属与晶体在极端条件下的行为,从而极大地加速了材料科学的研究进程。
AI加速改酶,落地再生PET千吨级产线,「塑新科技」完成数千万元pre-A轮融资
废弃高分子材料生物回收平台“塑新科技”完成数千万元pre-A轮融资。该公司利用AI技术加速酶的挖掘、改造和进化,专注于PET聚酯的生物酶法回收。目前,公司已成功运营千吨级中试产线,并计划在2025年底建成万吨级产线。其目标是在2030年前,使生物法再生PET的成本低于石化原生PET,展示了AI在合成生物学和环保科技领域的巨大商业潜力。
Google推出Agent Payments Protocol以标准化AI交易
谷歌联合超过60家支付和科技公司,推出了代理支付协议(AP2),这是一个旨在让AI代理能够安全、可验证地进行支付的开放标准。该协议通过名为“Mandates”的加密签名数字合同,为代理主导的交易建立授权和问责基础。此举是为即将到来的自主AI代理经济活动铺平道路的关键一步,旨在为AI Agent的商业交互建立统一的底层规则。
国内首次 AI 大模型众测结果揭晓:含腾讯阿里百度智谱等公司产品,累计发现各类安全漏洞 281 个
国内首次针对AI大模型的实网众测结果公布。活动共测试了15款主流大模型产品,累计发现281个安全漏洞,其中大模型特有漏洞占177个。报告指出,提示注入、信息泄露和不当输出是普遍存在的风险。腾讯混元、百度文心一言、阿里通义和智谱清言等产品在测试中表现出较高的安全防护水平。此次众测揭示了当前大模型在安全领域的共性挑战,为行业安全体系建设提供了重要参考。
报告指出,中国文旅产业正经历由AI技术驱动的深刻变革,消费需求从追求“性价比”转向体验内在价值的“心价比”。数据显示,2025年上半年国内居民出游总花费同比增长15.2%。AI技术正从文旅行业的单点应用,向平台化、生态化方向演进,通过“需供同智”模式,实现需求与供给两侧的智能化协同进化,重塑旅游产品的规划、营销和体验全链路。
报道显示,数以千万计的用户正在使用基于宗教文本训练的AI聊天机器人寻求精神慰藉甚至进行忏悔。例如,“圣经聊天”等应用下载量已超3000万次。这些应用通常基于大型语言模型,通过分析数据模式生成文本,而非真正具备情感或神圣启示。这一现象引发了关于AI伦理的讨论,即AI在扮演精神导师这类需要深度共情和理解的角色时,其能力的边界和可能对用户产生的潜在影响。
点评
今天的新闻看下来,有两条线越来越清晰。
第一条线是**“下沉”**,AI正从云端模型能力的“军备竞赛”下沉到具体的作业流里。无论是OpenAI和Anthropic抢占IDE,还是苹果把智能无缝织入操作系统,本质都是争夺“上下文”的入口,谁能贴近最终任务,谁就能构建最强的生态粘性。纯粹的模型API调用会越来越像水电,价值被管道和终端稀释。
第二条线是**“基建”**。当大家还在惊叹于机器人空翻、AI生成视频时,更底层的变革正在发生。Mira Murati去解LLM的“确定性”问题,Google为Agent制定支付标准,这些才是构建下一代可信、自主AI系统的地基。这标志着行业正在从“炼丹”式的模型探索,转向构建大规模、可靠系统的工程化阶段。花哨的应用固然吸引眼球,但真正的护城河,往往是这些看不见的底层协议和工程确定性。