2025.10.16.04 过去4小时全球AI发生了什么?

以下是过去4小时全球AI领域的最新动态:

  1. Anthropic 发布 Claude Haiku 4.5 模型 - 歸藏(guizang.ai)

    Anthropic公司发布了最新的小型模型 Claude Haiku 4.5,该模型在性能上已接近五个月前的顶级模型 Claude Sonnet 4,但成本仅为后者三分之一,速度却提升两倍。尤其在如Claude for Chrome等电脑操作任务中,Haiku 4.5的表现甚至优于Sonnet 4。其定价极具竞争力,输入和输出每百万Token分别仅需1美元和5美元。Haiku 4.5现已全面集成到Claude平台、Claude Code以及Droid CLI中,旨在提供更高效、经济的AI服务。

  2. Sam Altman 澄清 ChatGPT 政策变更 - Sam Altman

    OpenAI首席执行官Sam Altman针对ChatGPT即将进行的政策变更进行了澄清。他强调,OpenAI将继续优先保护未成年人的安全,而非其隐私和自由,同时不会放松对心理健康相关内容的政策。对于成年用户,OpenAI致力于提供更多使用自由,将其视为成熟个体对待,类似于社会中R级电影的分类标准。然而,平台仍将禁止导致伤害他人的内容,并会对处于心理健康危机中的用户提供区别对待的帮助。

  3. ElevenLabs 靠“声音”驯服巨头,重塑AI音频未来 - 宝玉

    在大型多模态AI模型涌现的浪潮中,初创公司ElevenLabs凭借其在AI音频领域的专注和深度创新,成功突围并成为独角兽。该公司通过深度理解文本上下文并捕捉情感 nuances的语音AI技术,以及构建包含非语言元素的高质量、高标注密度语音数据集,使其TTS模型能够生成更自然、富有表现力的声音。此外,ElevenLabs采取产品化先行策略,通过面向专业消费者和创作者的beta产品实现病毒式传播,随后成功与Epic Games、Time Magazine等巨头建立合作,证明了垂直领域极致专注的价值,并预示语音将成为未来人机交互的核心界面。

  4. Vercel 打造生成式Web,AI驱动软件开发新范式 - 宝玉

    Vercel正通过其创新产品V0引领生成式Web的革命,旨在利用AI将软件开发从代码编写转变为自动化生成。CEO Guillermo Rauch认为,大型语言模型如ChatGPT能够出色地编写代码,标志着软件开发领域的“代际飞跃”。V0允许用户通过自然语言描述来生成可运行的前端应用,极大地降低了创造门槛,使得设计师和营销人员也能轻松构建产品原型。Vercel不仅注重生成效率,还通过定制模型训练确保AI生成代码的高质量和“品味”。值得注意的是,ChatGPT已成为Vercel增长最快的客户获取渠道,预示着未来的营销将侧重“AI优化”。Vercel展望了一个“自治基础设施”和“自修复应用”的未来,其中App将是“按需生成”的“数字生命体”。

  5. Google AI在科学、语音及视频模型方面取得进展 - Emad, Andrew Ng, Demis Hassabis

    Google AI近期在多个关键领域展现了显著进展。在科学研究方面,其与耶鲁大学合作、基于Gemma模型构建的C2S-Scale 27B基础模型,已成功用于生成新型材料。在人机交互领域,Google推出了一门新课程“使用Google ADK(Agent Development Kit)构建实时语音智能体”,旨在教授如何创建能听、推理、响应的语音助手,并处理复杂任务如播客创作,同时保持低延迟。此外,Google的视频模型Veo 3.1也获得了重大升级,提升了真实感、音频质量、场景扩展能力、叙事控制以及编辑精度,目前已可在labs.google和Gemini App中体验。