DeepSeek发布实验性模型V3.2-Exp,大幅提升长文本推理效率并降低成本-小互 DeepSeek发布了其最新实验性语言模型 DeepSeek-V3.2-Exp,该模型在推理效率和计算成本方面实现了显著提升。V3.2-Exp在整体性能上与V3.1-Terminus持平,但长文本推理效率提高了约一倍,使得其 API价格大幅下降50%。这一突破主要得益于其引入的 稀疏注意力(DSA)机制,该机制能够智能地聚焦文本中的关键部分,从而在不影响输出质量的前提下,显著加快处理速度并减少显存占用,特别适合处理 超过32K tokens 的长文档和对话场景。 Merve Noyan公开分享多模态AI幻灯片,涵盖趋势、模型与工具-merve …
阅读更多