2025.09.29.20 过去4小时全球AI发生了什么?


  1. DeepSeek发布实验性模型V3.2-Exp,大幅提升长文本推理效率并降低成本-小互

    DeepSeek发布了其最新实验性语言模型 DeepSeek-V3.2-Exp,该模型在推理效率和计算成本方面实现了显著提升。V3.2-Exp在整体性能上与V3.1-Terminus持平,但长文本推理效率提高了约一倍,使得其 API价格大幅下降50%。这一突破主要得益于其引入的 稀疏注意力(DSA)机制,该机制能够智能地聚焦文本中的关键部分,从而在不影响输出质量的前提下,显著加快处理速度并减少显存占用,特别适合处理 超过32K tokens 的长文档和对话场景。

  2. Merve Noyan公开分享多模态AI幻灯片,涵盖趋势、模型与工具-merve

    Merve Noyan 公开分享了一份关于多模态AI的幻灯片,内容全面,涵盖了当前多模态AI的 趋势与应用、出色的开源模型、以及用于定制和部署多模态模型的工具。这份资源还提供了进一步的学习材料。Merve Noyan特别指出,幻灯片中提及的所有模型均可在 Hugging Face 上获取,并且通过仅两行代码即可轻松加载使用,极大地降低了开发者和研究人员的上手难度。

  3. Emad Mostaque对“AI泡沫”论的看法:AI具有经济价值-Emad

    Stability AI的创始人Emad Mostaque就当前关于“AI泡沫”的讨论发表了看法。他明确指出,“AI是有用的。人们为它付费,因为它具有经济价值。” 这一观点强调了AI技术的实际应用价值和市场需求,表明他认为AI领域当前的投资和发展并非虚高的泡沫,而是基于其能够创造实际经济效益的坚实基础。