AudioFly
互联网
2025-10-05 18:32:27
AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构,拥有10亿参数,通过大量开放数据集(如AudioSet、AudioCaps、TUT)及内部专有数据训练而成。AudioFly 能根据文本描述生成高质量音频,采样率高达44.1kHz,生成的音效与文本描述高度匹配。模型在单事件和多事件场景下均表现出色,在AudioCaps数据集上性能卓越,超越以往的音频生成模型。AudioFly 适用短视频配音、有声故事生成等领域,为声音创作带来无限可能。





![杨幂代言宝家洁啦!绝美小卡我也要拿下[打call]我来啦 - 微博](https://imgs.knowsafe.com:8087/img/aideep/2025/6/24/78d3d36b3a8d7e7b12b039f4b01f2f44.jpg?w=250)

