2025.09.20.20 过去4小时全球AI发生了什么?

  1. TheWorldLabs 展示通过单张图片生成3D环境的强大潜力-Fei-Fei Li

    人工智能领域的重要人物李飞飞教授转发推文,展示了 TheWorldLabs 在通过单张图片生成复杂 3D 环境方面的巨大潜力。据分享,其“Marble”工具能够仅凭一张图片创建出“洞穴式餐厅3D环境”。这表明了 AI 驱动的3D内容创作正在取得显著进展,有望大幅简化设计流程,并为沉浸式体验提供更高效的工具。

  2. OpenAI Sora 视频生成模型被指训练数据来源广泛-Gary Marcus

    Gary Marcus 转发了一条推文,透露 OpenAI 的视频生成模型 Sora 似乎在极其广泛和多样化的数据集上进行了训练。该数据集据称涵盖了包括 好莱坞电影、Netflix 节目、TikTok、Twitch、NBA 赛事以及电子游戏等多种媒体类型。这种全面的训练数据很可能是 Sora 能够生成高质量、逼真且多样化视频内容的关键因素,引发了业界对版权和数据来源的进一步关注。

  3. 多模态AI研究热度持续攀升-merve

    Merve 宣布将于下周在伦敦的 @ultralytics Yolo Vision 大会上发表演讲,并强调了 多模态AI 的热度正在持续升温。这一观点凸显了当前人工智能领域的一个重要趋势,即能够处理和理解文本、图像、视频等多种数据类型的模型正受到越来越多的关注和投入。在计算机视觉盛会上强调多模态,进一步确认了该领域在未来AI发展中的核心地位。