以下是过去4小时全球AI领域的最新动态: 阶跃开源Step Audio 2-7B端到端语音模型-歸藏(guizang.ai) 阶跃AI近日开源了其Step Audio 2-7B端到端语音模型,该模型凭借其7B的参数规模和仅需24G显存即可本地部署的特性,在HuggingFace trending榜单上迅速走红。这款模型专注于实时语音对话,并具备强大的理解能力,能够通过推理感知说话人的语义信息、非语言信息以及非声带信息,从而判断年龄、性别、情绪甚至环境音。这显著弥补了传统语音转文本方式在传达音调、语气、情绪等信息上的缺失。Step Audio 2-7B还支持工具调用与多模态RAG,极大地扩展了其在垂直行业语音客服等领域的应用潜力,并提 …
阅读更多