2025.10.02 全球AI新闻速递
今日全球AI动态聚焦于应用层的爆发与硬件层的军备竞赛。OpenAI发布Sora 2并推出社交应用,意图将视频生成能力直接转化为消费级产品,挑战现有社交格局。为支撑其庞大算力需求,OpenAI与三星、SK海力士达成内存芯片供应协议。与此同时,硬件竞赛全面升级:Meta收购RISC-V芯片公司Rivos以强化自研能力,苹果则搁置Vision Pro升级,将重心转向AI智能眼镜。在应用端,谷歌将Gemini全面融入智能家居生态,而Snowflake则推出“10分钟构建”的AI代理平台,持续降低AI开发门槛。
OpenAI发布Sora 2,推出社交应用并支持用户“入镜”
OpenAI正式发布了其第二代视频生成模型Sora 2,新模型在生成带有同步对话和音效的视频方面取得了显著进步。同时,OpenAI推出了一款名为“Sora”的iOS社交应用,允许用户创建、混剪AI视频。其核心亮点是“cameos”功能,用户可通过一次性录制,将自己无缝插入到任何Sora生成的场景中。此举被视为对TikTok和Instagram等现有社交平台的直接挑战,标志着生成式AI正从技术演示全面走向内容创作和社交娱乐。
OpenAI首席执行官萨姆·奥尔特曼访问韩国,与三星电子和SK海力士签署了内存芯片供应意向书。这两家韩国半导体巨头将为OpenAI的数据中心供应关键的内存芯片,以支持其宏大的Stargate项目。该项目旨在建设下一代AI数据中心,满足AI模型训练和推理带来的爆炸性算力需求,此举也凸显了顶级AI公司对上游硬件供应链的战略布局日益加深。
苹果公司已暂停对Vision Pro头显的升级计划,将研发资源优先投入到能与Meta产品竞争的智能眼镜上。据悉,苹果正在开发至少两种智能眼镜,一种是无独立显示屏、需与iPhone配对使用的轻量级产品,另一种则配备显示屏,直接对标Meta的雷朋智能眼镜。这些设备将高度依赖语音交互和人工智能,标志着苹果正将战略重心从沉浸式VR转向更具普适性的AI可穿戴设备。
Meta计划收购RISC-V芯片企业Rivos,强化AI芯片自研能力
为增强其AI芯片技术栈并减少对外部供应商的依赖,Meta计划收购高性能RISC-V芯片初创公司Rivos。Rivos在设计基于开源RISC-V架构的全栈式AI系统方面拥有深厚专长。此次收购将加速Meta的定制芯片计划(MTIA),为其庞大的AI模型训练和推理任务提供底层硬件支持,是其应对高昂GPU成本并构建长期技术护城河的关键一步。
谷歌对其智能家居产品线进行了重大革新,核心是全面集成Gemini AI。公司发布了全新的Google Home应用,提供AI增强通知和事件摘要功能。同时推出了三款新的Nest摄像头和门铃,以及一款内置Gemini助手、售价99美元的新款Google Home智能音箱。用户可以通过自然语言查询家庭状态,标志着谷歌正将对话式AI深度融入家庭物联网场景。
微软推出Microsoft 365 Premium订阅,整合Office与Copilot Pro
微软推出了名为Microsoft 365 Premium的全新订阅方案,每月定价19.99美元。该方案将传统的Microsoft 365(包含Office套件)与Copilot Pro的功能深度整合。订阅者不仅可以使用Word、Excel等桌面应用,还能享受Copilot Pro的全部功能和更高的使用限额,并能提前体验Office Agent等创新AI功能。此举旨在将AI助手能力更紧密地捆绑到其核心生产力软件生态中。
Snowflake发布Cortex Agents,承诺10分钟构建企业级AI代理
数据云公司Snowflake推出了其托管服务Cortex Agents的公开预览版。该服务隶属于其新的无代码AI平台Snowflake Intelligence,旨在让企业能够在10分钟内构建出能够连接内外部API的AI代理。平台能够融合结构化和非结构化数据,帮助企业从原始数据快速转向可操作的业务洞察,极大地降低了企业应用AI的门槛和开发周期。
由AI生成的虚拟角色“Tilly Norwood”在好莱坞引发了巨大争议。美国演员工会(SAG-AFTRA)发表强硬声明,坚决反对使用此类合成演员。工会认为,这些AI角色在未经许可和补偿的情况下利用了真人演员的表演成果进行训练,不仅缺乏真实的情感体验,更直接威胁到演员的工作机会和生计。这一事件凸显了AI技术在创意产业应用中日益激化的劳资矛盾与伦理冲突。
谷歌DeepMind研究:当前AI视频模型对真实世界的模拟仍不稳定
谷歌DeepMind团队通过一系列严谨测试,评估了其视频模型Veo 3对真实世界物理规律的理解和模拟能力。研究发现,尽管模型在某些任务(如抛接球)上表现出色,但在需要更复杂物理推理的任务(如模拟火焰燃烧纸张)上则表现不佳且不稳定。这表明,虽然AI视频生成技术进步神速,但距离成为能够准确、稳定地推理和模拟现实世界的通用视觉基础模型还有很长的路要走。
Anthropic与Accel合作,在印度班加罗尔举办首场开发者活动
AI安全领域的初创公司Anthropic宣布将于10月11日在印度班加罗尔举办其在该国的首次开发者活动。此次活动与风险投资公司Accel合作,旨在鼓励印度开发者使用其最新的Claude Sonnet 4.5模型构建企业代理和垂直领域的AI应用。此举表明Anthropic正在积极拓展其在亚洲关键市场的开发者生态,并加速其模型在企业级场景的落地。
今天的牌桌上,玩家们的动作已经非常清晰。
OpenAI的Sora 2加上社交App,这步棋不是简单的技术迭代,而是从模型层到应用层再到生态层的垂直整合,意图非常明显:抢夺用户时长,把AI生成的内容直接货币化。而为了支撑这个野心,转身就去韩国敲定存储芯片大单,这是典型的“前线打仗,后方补给”的打法,算力就是军火,一点都不能含糊。
另一边,苹果和Meta的路径选择出现了有趣的分野。苹果在Vision Pro上的“暂停”并非认输,而是意识到在当前技术和成本下,试图一步到位打造完美沉浸式体验的路径太重、太慢。转而押注AI智能眼镜,是典型的降维攻击思路,先用轻量级、AI驱动的交互方式渗透市场,培养用户习惯。而Meta收购Rivos,则是在补强自己的底层能力,用RISC-V的开放架构对抗NVIDIA的封闭生态,这是为十年后的战争储备弹药。
看下来,无论是应用层的狂飙突进,还是硬件层的合纵连横,本质都是在争夺下一代计算平台的定义权。应用拉动算力需求,算力决定应用天花板。一边是微软、谷歌这些巨头把AI能力无缝“注入”到现有产品中,稳固基本盘;另一边是Snowflake这类平台在不断降低AI的开发门槛,试图赋能万千企业。
至于演员工会的抗议,不过是技术浪潮拍打在旧礁石上的必然声响。真正值得思考的是,当内容生产的边际成本趋近于零时,价值的锚点究竟会落在哪里?是模型本身,是交互体验,还是独一无二的数据?这才是决定未来谁能真正坐庄的关键。