StableAvatar
互联网
2025-10-05 18:13:51
StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生引导机制和动态加权滑动窗口策略,能生成无限长度的高质量虚拟形象视频。模型解决了现有模型在长视频生成中出现的身份一致性、音频同步和视频平滑性问题,显著提升生成视频的自然度和连贯性,适用虚拟现实、数字人创建等场景。

![蔡雪凝嗯新年愿望:岁岁平安 遂遂平安[福气虎] ](https://imgs.knowsafe.com:8087/img/aideep/2022/2/6/7802c7da3c2e96c51f834068494a68a0.jpg?w=250)
![桥本茶 天冷多添衣o[兔子] ](https://imgs.knowsafe.com:8087/img/aideep/2022/3/25/56022f1a180b211d2f33637a46e59fe4.jpg?w=250)




