2025.09.17.08 过去4小时全球AI发生了什么?

  1. YouTube Shorts推出AI新功能:Veo 3和Lyria 2-Demis Hassabis

    Demis Hassabis 宣布YouTube Shorts上线了两项强大的AI新功能。Veo 3能够根据文本提示生成带有集成音频的视频片段,极大地简化了视频创作流程。同时,Lyria 2则支持“Speech to song”功能,可以将视频对话内容自动转化为配乐,为用户提供更丰富的音频创作体验。

  2. AI助力手持超声波技术实现医生级技能-Peter H. Diamandis, MD

    Peter H. Diamandis 博士展望了AI在医疗领域的应用前景,指出未来人们可以通过AI引导的手持超声波设备,即时获得医生般的诊断技能。这项技术有望让专业医疗诊断更加普及,降低操作门槛,使普通用户也能进行高效的身体检查。

  3. AI辅助编程指南与工具进展:YC Vibe Coding、OpenAI Codex及Gall定律讨论-宝玉

    宝玉分享了YC 编写的《Vibe Coding 指南》,这是一份详细的AI协同编程策略,涵盖了流程规划、版本控制、测试框架、Bug 修复、AI 工具优化及复杂功能开发。指南强调制定清晰计划、小步快跑、利用 Git、编写高层级测试、善用错误信息、多模型协作和模块化架构。同时,OpenAI Codex 引入了针对前端UI开发的截图对比差异功能,通过 PlayWright 实现工作闭环,提升了开发效率。文章还引出了对 Gall定律的讨论:AI编码能否打破复杂系统必须从简单演进的规律,直接构建复杂系统。

  4. 空间智能与3D内容生成技术:World Labs Marble的创新-Fei-Fei Li

    Fei-Fei Li 教授分享了关于空间智能和大规模 3D 内容生成的最新进展,特别是提到了 World Labs 的新工具 Marble。该工具能够生成并拼接复杂的 3D 场景,为人类共享的数字世界提供新的创建方式,显示了在构建沉浸式数字环境方面的巨大潜力。

  5. AI搜索与语言模型使用趋势的转变-David

    David 观察到,在他身边的朋友中,越来越多的人开始用 Perplexity 取代 Google 搜索,并用 Gemini 取代 ChatGPT。这一趋势表明了用户对不同AI搜索工具和大型语言模型的偏好正在发生转变,可能预示着AI驱动的搜索和对话式AI市场格局的动态变化和竞争的加剧。

  6. FAIR化学排行榜发布,推动社区基准测试-clem 🤗

    Clement Delangue 转发宣布FAIR Chemistry Leaderboard已正式发布。该平台旨在提供一个集中化的空间,支持团队进行化学领域的社区基准测试工作,以促进更开放、可复现的AI化学研究和应用。

  7. Hugging Face公共数据集突破50万大关-merve

    Merve 转发消息指出,Hugging Face 的公共数据集数量已成功突破 50 万大关,并且平均每 60 秒就有一个新数据集被分享。这一里程碑反映了开源AI社区的惊人活力和数据共享的持续增长,为全球AI研究与开发提供了极为丰富的资源支持。

  8. AI新书《Scout Mindset》引发业界争议-Gary Marcus

    Gary Marcus 提及一本由 E.S. Yudkowsky 和 S. Soares 合著的新书,其重要性在业界引起了极大争议。Max Tegmark 称其为“有史以来最重要的书”,而《纽约时报》却将其比作“科学教”。Gary Marcus 将在后续的对话中阐述他更为温和的观点,凸显了业界对AI发展方向和相关哲学思想的多元而又尖锐的讨论。