unabebe

CombatVLA

互联网 2025-08-20 15:11:38

CombatVLA 是淘天集团未来生活实验室团队推出的专为3D动作角色扮演游戏(ARPG)中的战斗任务设计的高效视觉-语言-动作(VLA)模型。模型基于3B参数规模,通过动作追踪器收集的视频动作对进行训练,数据格式化为“动作思维”(AoT)序列。模型用三阶段渐进式学习范式,从视频级到帧级再到截断策略,实现高效推理。CombatVLA 在战斗理解基准测试中超越现有模型,推理速度提升50倍,任务成功率高于人类玩家。