以下是过去4小时内全球AI领域的重要动态: SoulX-Podcast语音模型发布,实现高真实度、长时段、多说话人语音生成-小互 Soul发布了SoulX-Podcast语音模型,实现高真实度、长时段、多说话人、多语种(中英双语+多方言)播客式语音生成。该模型具备方言和副语言控制能力(如笑声、叹息声、呼吸声),可连续生成90分钟以上的对话内容而不失稳定性。SoulX-Podcast还支持在零样本条件下完成声音与语气的克隆与迁移,显著提升了语音表达的真实感与感染力,并支持情境化生成,改善播客式语音的韵律变化与情绪丰富度。 玉伯的Youmind更新至0.5版本,整合研究创作产出流程-歸藏(guizang.ai) 玉伯的Youmind更新 …
阅读更多