LongCat-Flash-Omni
互联网
2025-11-09 02:36:45
LongCat-Flash-Omni 是美团 LongCat 团队开源的全模态大语言模型,基于 LongCat-Flash 系列高效架构设计,创新性地集成多模态感知和语音重建模块,拥有 5600 亿总参数(激活参数 270 亿),实现低延迟的实时音视频交互能力。模型采用渐进式多模态融合训练策略,具备强大的文本、图像、音频、视频理解及生成能力,在全模态基准测试中达到开源最先进水平(SOTA)。模型为开发者提供高效的技术选择,推动多模态应用场景的发展。

![SNH48-颜沁 发现了你是我唯一 想要的答案[抱一抱] ](https://imgs.knowsafe.com:8087/img/aideep/2022/3/13/5622394b476250a7ab5f84739973c5a8.jpg?w=250)





