首页
抖音
B站
网络
投稿
首页
抖音
B站
网络
Ming-UniAudio
Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transformer 架构的连续语音分词器...
查看更多
Karlee Grey
10-08