首页
抖音
B站
网络
投稿
首页
抖音
B站
网络
VibeVoice-ASR
VibeVoice-ASR 是微软开源的先进语音识别模型,专为处理长达60分钟的长音频设计。模型能一次性处理整段音频,保持全局上下文,避免传统模型分段处理导致的上下文丢失。模型生成的转录文本包含语音内...
查看更多
塔塔
01-26