Dreamer 4
互联网
2025-10-05 09:47:23
Dreamer 4 是由 DeepMind 开发的新型智能体,通过在快速且准确的世界模型中进行想象训练来解决复杂的控制任务。在《我的世界》(Minecraft)游戏中,Dreamer 4 仅使用离线数据就成功获得了钻石,是该领域的一个重要突破。通过在世界模型中进行强化学习来训练行为,无需与环境进行在线交互。在实际应用中(如机器人技术)具有更高的安全性和效率,因为在线交互可能存在安全风险且效率低下。
Dreamer 4 的世界模型基于高效的 Transformer 架构和新的 shortcut forcing objective,能在单个 GPU 上实现实时交互推理。能从少量数据中学习一般动作条件,并且可以从大量未标记的视频中吸收大部分知识。