SoulX-Podcast
互联网
2025-11-09 03:18:58
SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等),具备跨方言提示功能,可通过普通话提示生成目标方言语音。模型支持副语言控制(如笑声、叹气等),增强语音合成的真实感。SoulX-Podcast 能生成超过 90 分钟的连贯对话,保持稳定的音色和情感连续性,适用于播客、有声读物等场景。


![Tiffanyzyc:代价是满腿的蚊子包[泪] ](https://imgs.knowsafe.com:8087/img/aideep/2021/7/2/0a3d5bb1b8003421056adae1ce47ef7c.jpg?w=250)
![杨雨潼目光所致,皆为华夏#一甜自拍迎国庆# 快来get我的同款吧~[并不简单] ](https://imgs.knowsafe.com:8087/img/aideep/2022/6/14/d38527cd7eb831d91f109bfe1f4c200d.jpg?w=250)



