2025.09.01.20 过去4小时全球AI发生了什么?
以下是过去4小时全球AI领域的最新动态:
阶跃开源Step Audio 2-7B端到端语音模型-歸藏(guizang.ai)
阶跃AI近日开源了其Step Audio 2-7B端到端语音模型,该模型凭借其7B的参数规模和仅需24G显存即可本地部署的特性,在HuggingFace trending榜单上迅速走红。这款模型专注于实时语音对话,并具备强大的理解能力,能够通过推理感知说话人的语义信息、非语言信息以及非声带信息,从而判断年龄、性别、情绪甚至环境音。这显著弥补了传统语音转文本方式在传达音调、语气、情绪等信息上的缺失。Step Audio 2-7B还支持工具调用与多模态RAG,极大地扩展了其在垂直行业语音客服等领域的应用潜力,并提供了Step-Audio 2 mini和Step-Audio 2 mini base两个版本供开发者使用。
向阳乔木宣布将于本周六晚8点邀请增长专家Yangyixxxx举办一场关于AI产品出海营销的线上分享会。Yangyixxxx在社交媒体运营方面拥有丰富经验,曾在短时间内将X平台关注者提升至10万以上,小红书关注者在15天内突破1万。本次分享会将围绕独立开发者如何低成本冷启动、推荐稳定且能落地国内的收款方式及支付避坑指南,以及前期冷启动阶段的有效方法(如外链和社媒策略)等核心问题展开,为希望拓展海外市场的AI产品开发者提供实用指导。
向阳乔木近期开源了多款实用的AI相关开发者工具。其中包括一款Chrome插件,能够自动截屏并将内容收藏到飞书多维表格中,极大地提高了信息收集效率。此外,还发布了一个工具,支持从指定的多维表格内容一键生成网站,并可方便地部署到Vercel。另一项重要开源是Nano Banana画布工具,它基于drawinx开源白板二次开发,简化了设计流程并支持图片生成交互功能,同样支持Vercel一键部署,为用户提供了更便捷的图像创作体验。另有其他几款产品也已开源并正在申请Chrome Web Store上架。