2025.10.18 全球AI新闻速递
今日全球AI领域呈现出软硬件两翼齐飞的态势。硬件层面,英伟达Blackwell芯片在美国本土的成功下线,标志着全球AI算力供应链格局的深刻变化。软件层面,AI正加速从模型能力向“代理”能力进化,Anthropic为Claude赋予“技能”,Zoho则将其应用于企业工作流,预示着AI执行复杂任务时代的到来。同时,具身智能赛道持续升温,资本与开源社区共同发力。在激烈的市场竞争中,谷歌凭借生态优势冲击Adobe,再次印证了应用场景与分发渠道的重要性。
黄仁勋亲赴庆祝:首片美国产英伟达 Blackwell 晶圆在台积电亚利桑那工厂下线
英伟达CEO黄仁勋亲临台积电亚利桑那州工厂,庆祝首片在美国本土生产的 Blackwell 架构晶圆成功下线。此举不仅意味着作为全球AI基础设施核心的Blackwell芯片正式在美国进入量产,更被黄仁勋称为美国“再工业化”愿景的重要体现。台积电该工厂未来将承接2纳米至4纳米等先进工艺制程,为人工智能、高性能计算等前沿领域提供关键的芯片支持。
文心4.5最强衍生模型发布,PaddleOCR-VL登顶OCR综合性能全球第一
百度发布并开源了其自研的多模态文档解析模型 PaddleOCR-VL。该模型在全球权威评测榜单 OmniBenchDoc V1.5 中以92.6分的成绩位列综合性能第一。其核心模型参数量仅为 0.9B,具备轻量高效的特点,能精准处理文本、手写字、表格、公式等复杂元素,并支持多达 109种语言,为政企文档管理、知识检索等场景提供了强大的AI能力。
Anthropic 为 Claude 提供新“Agent Skills”以掌握现实世界任务
Anthropic为其Claude模型推出了名为 Agent Skills 的新框架,旨在赋予模型程序化知识和特定领域的专业能力。开发者可以通过指令、脚本和资源打包成有组织的文件夹,让Claude能够按需加载和解释,从而执行更复杂的现实世界任务。该系统采用“逐步披露”原则,避免上下文窗口过载,例如,一项PDF技能可以调用Python脚本来完成填表或提取字段等高级操作。
具身智能公司 穹彻智能 近日宣布获得阿里巴巴集团的新一轮投资。该公司致力于打造实体世界大模型和“以力为中心”的具身智能大模型,并已推出升级版产品 Noematrix Brain 2.0。本轮融资将用于加速技术研发和应用落地,重点突破无本体数据采集、通用端到端模型等关键技术,打通从数据到部署的全链路,目前已与零售、家居领域的头部企业展开合作。
北京人形机器人创新中心开源了一个全新的具身世界模型架构——WoW (World-Omniscient World Model)。该模型旨在让机器人能够真正地“看见、理解并行动于世界”,通过构建对物理世界的全面认知,帮助具身智能机器人更快速地学习和掌握各项复杂技能,推动具身智能技术的进一步发展。
Banana Blitz: Google’s Nano Banana AI Just Gave Adobe’s Firefly a Nasty Shock
谷歌在其 Gemini 2.5 Flash 中集成了新的图像生成器 Nano Banana,并将其深度嵌入Google搜索、NotebookLM等生态产品中,对Adobe Firefly造成了巨大冲击。数据显示,在Nano Banana推出后的一周内,Firefly的下载量下降了超过50%,而Gemini的安装量则飙升了300%以上。这起事件凸显了将AI功能无缝集成到现有高流量平台中的巨大威力。
Zoho公司宣布在其协作、客户体验和人力资源产品线中推出新的 Agentic AI 功能,并且免费提供给用户。这些AI代理旨在通过自动化复杂的跨应用任务,消除企业采用AI的障碍。例如,新的AI代理可以连接Zoho Mail和CRM,自动将邮件中的销售线索转换为潜在客户,显著提升了企业工作流程的自动化水平和效率。
Plaid首席执行官预测:AI将比我们想象的更快地管理我们的资金
金融科技公司Plaid的CEO Zach Perret预测,人工智能将很快从提供财务建议转向直接管理用户的资金,包括自动转账、支付账单和进行投资。他认为,随着OpenAI等平台将AI与消费服务打通,金融领域的全自动化将成为现实。这一趋势预示着金融服务将进一步代码化和智能化,但同时也引发了关于算法决策信任度和人为控制必要性的讨论。
国内保险业AI科技解决方案提供商 暖哇科技 正在寻求上市。该公司核心业务是为保险公司提供AI承保和AI理赔解决方案。尽管其营收复合年增长率高达65%,但在2022年至2025年上半年的两年半时间里,累计亏损已超过7亿元人民币。在头部险企纷纷自研AI技术的背景下,其市场空间、对大股东众安在线的业务依赖以及持续亏损问题,成为其IPO之路面临的主要挑战。
一股AI创业潮正由前大型科技公司的高管们引领。包括前Databricks AI副总裁Naveen Rao、前GitHub CEO Thomas Dohmke、前OpenAI CTO Mira Murati在内的多位行业领袖已离职创办自己的AI公司。这些新公司的方向涵盖了AI计算、思维机器、材料科学AI科学家等多个前沿领域,显示出顶级人才正加速涌入AI创业生态,探索新的技术和商业边界。
百度世界 2025 大会将于 11 月 13 日在北京举行,主题“效果涌现”
百度宣布,百度世界 2025 大会 将于11月13日在北京国家会议中心举行。本届大会的主题为“效果涌现 | AI In Action”,暗示将重点展示AI技术在实际应用中的具体成效。届时,百度创始人李彦宏将分享其最新的AI思考,并发布多项AI应用和产品升级。
苹果 M5 Vision Pro 头显“Mac 虚拟显示”刷新率翻倍,将改善运动眩晕问题
苹果计划在搭载 M5 芯片的新款Vision Pro头显上,将“Mac虚拟显示”功能的刷新率从60Hz提升至 120Hz。这一关键升级有望显著改善用户在虚拟空间中观看Mac屏幕时的运动眩晕问题。此外,得益于M5芯片更强的GPU性能和改进的注视点渲染技术,新款头显的显示清晰度也将获得小幅提升。
针对网络上关于公司组织调整与部门解散的传闻,智谱AI 官方回应称,目前公司产品和研发相关部门运转正常。此次组织调整仅涉及十余名员工,主要是为了配合公司的 MaaS(Model as a Service)战略转型。
科技昨夜今晨 1018:华为鸿蒙 HarmonyOS 6 官宣 10 月 22 日发布;小米车主受网络攻击进展公布;“史上最薄”首批国行苹果 iPhone Air 售罄…
科技行业动态摘要:华为终端正式宣布将于 10月22日 举行鸿蒙操作系统6的特别发布会。此外,苹果计划在2026年对MacBook Pro进行重大更新,高端型号或将采用OLED打孔屏。小米方面则公布了车主遭网络攻击事件的援助信息收集进展,并任命了新的中国区市场部总经理。
今天的几条新闻串起来看,很有意思。
首先,英伟达在美国本土造出Blackwell,这不仅仅是技术问题,更是地缘政治和供应链的再平衡。牌桌上的筹码开始移动了,算力作为AI时代的石油,其生产权的归属,决定了未来很长一段时间的竞争格局。所有上层的模型和应用,最终都要落到这块硅基上。
其次,从模型到**“代理”(Agent)**的趋势已经非常清晰。Anthropic的“Skills”框架,说白了就是在给大模型装“插件”和“工具箱”,让它从一个“聊天的”变成一个“干活的”。这才是AI真正能改造生产力的底层逻辑。谁能率先构建起强大的Agent生态和执行能力,谁就能拿到下一阶段的入场券。
再看具身智能,阿里下注,北京队开源,赛道很热。但这东西的链条极长,从感知、决策到控制,每一步都是硬骨头。资本的热情是好事,但要警惕泡沫。最终比拼的不是算法有多花哨,而是谁能率先打通数据采集、模型训练和硬件部署的商业闭环,并把成本降到可用范围。
最后,谷歌对Adobe的降维打击,以及暖哇科技带亏上市,揭示了AI商业化的残酷现实。技术再牛,没有合适的场景和渠道,就是空中楼阁。而即使找到了场景,如何构建健康的单位经济模型(Unit Economics),摆脱烧钱换增长的模式,才是决定一家AI公司能走多远的关键。技术理想主义,最终还是要回归商业本质。