2025.10.01.04 过去4小时全球AI发生了什么?

  1. OpenAI 正式发布 Sora 2 模型及同名应用,赋能创意视频生成-Sam Altman

    OpenAI 首席执行官 Sam Altman 正式宣布推出 Sora 2 视频生成模型及其配套的 Sora 应用程序。Altman 将其誉为“创意领域的ChatGPT时刻”,旨在大幅简化视频创作过程。Sora 2 显著提升了视频的真实感和电影感,并引入了“客串(cameo)”功能,支持将指定人物融入视频中,从而创造出独特的社交互动体验。该 iOS 应用已在美国和加拿大区的App Store上线,ChatGPT Pro 订阅用户可使用 Sora 2 Pro 进行视频生成。OpenAI 团队表示已意识到此类服务可能带来的潜在负面影响,如成瘾、网络欺凌及深度伪造,并为此制定了详细的产品原则和缓解措施,包括优先用户满意度、内容控制、鼓励创作以及协助用户实现长期目标。

  2. LandingAI 升级 Agentic 文档提取功能,推出 DPT 模型-Andrew Ng

    著名AI专家吴恩达(Andrew Ng)宣布,LandingAI 大幅升级了其 Agentic 文档提取功能,并推出了全新的 DPT(Document Pre-trained Transformer)模型。该模型能够从复杂文档中,特别是大型且复杂的表格中,准确地提取数据。这一创新对金融和医疗保健等行业尤为关键,有望从目前“困在PDF文件中的暗数据”中释放巨大价值。新的 SDK 简化了集成过程,仅需三行代码即可使用,极大地降低了技术门槛,鼓励开发者利用此功能进行更多创新。

  3. AI 生态系统新进展:Hugging Face 集成、LLaVA-One 发布及GLM-4.6上线-Clement Delangue

    AI 生态系统近期迎来多项重要更新。Hugging Face 宣布,其 AI SDK 已全面支持直接访问 Hugging Face 平台上的任何模型,此举将进一步简化开发者的模型集成与使用流程。与此同时,一款名为 LLaVA-One 的多模态大型语言模型(LLM)以完全开源的形式发布,其开放的许可证、训练代码和预训练数据,彰显了开源AI社区的蓬勃发展。此外,GLM-4.6 模型也已正式上线 Hugging Face API,并获得了 Novita Labs 的支持,为用户提供了更多高性能模型的选择。

  4. OpenAI 宣布与 Oracle 达成巨额算力采购协议-Peter H. Diamandis, MD

    OpenAI 宣布与 Oracle 达成一项惊人的算力采购协议,价值高达每年600亿美元,以获取4.5吉瓦的计算容量。这一大规模交易的计算能力相当于两个胡佛水坝的发电量,凸显了 OpenAI 对超大规模计算资源持续增长的需求。此举不仅是 OpenAI 扩展其AI基础设施的关键一步,也反映了人工智能技术快速发展对全球算力基础设施带来的巨大需求,标志着AI行业在基础建设方面的一个重要里程碑。