烛灵儿

Ouro

互联网 2025-11-09 02:41:26

Ouro是字节跳动Seed团队联合多家机构发布的循环语言模型(Looped Language Models,LoopLM)。名称源于象征循环与自我吞噬的“衔尾蛇”(Ouroboros)。Ouro模型通过在潜在空间中进行迭代计算,将推理能力直接构建到预训练阶段,非仅依赖后期微调。采用两阶段自适应计算训练策略,展现出卓越的参数效率,1.4B和2.6B的模型在各类基准测试中,性能媲美甚至超越了规模大得多的SOTA LLM。Ouro模型的性能优势主要源于其强大的多步推理和组合事实能力,在高难度数学推理任务上表现尤为出色。Ouro模型的有害内容生成率更低,推理过程更具因果忠实性。