DeepSeek-R1

互联网 2025-01-28 01:10:39

DeepSeek-R1是幻方量化旗下 AI 公司深度求索（DeepSeek）2025年1月发布的模型，并同步开源模型权重。

发展历史

2025年1月20日消息，幻方量化旗下 AI 公司深度求索（DeepSeek）正式发布 DeepSeek-R1 模型，并同步开源模型权重。

2025年1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。

2025年1月26日消息，在短短一个月内，中国AI初创公司深度求索（DeepSeek）先后发布了DeepSeek-V3和DeepSeek-R1两款大模型，成本价格低廉，性能与OpenAI相当，让硅谷震惊，甚至引发了Meta内部的恐慌，工程师们开始连夜尝试复制DeepSeek的成果。

模型功能

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。

DeepSeek 称，DeepSeek-R1 蒸馏小模型超越 OpenAI o1-mini。DeepSeek 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时，通过 DeepSeek-R1 的输出，蒸馏了 6 个小模型开源给社区，其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。登录 DeepSeek 官网或官方 App，打开“深度思考”模式，即可调用最新版 DeepSeek-R1 完成各类推理任务。

*文章为作者独立观点，不代表爱思词典立场

本文由 JDSY051发表，转载此文章须经作者同意，并请附上出处( 爱思词典 )及本页链接。

原文链接 https://www.asapp.cn/b/hlw/8737.html

DeepSeek-R1 DeepSeek-R1-Zero DeepSeek 幻方量化深度求索