秋和柯基

DeepSeek

互联网 2024-12-27 13:41:27

DeepSeek大语言模型算法是北京深度求索人工智能基础技术研究有限公司推出的深度合成服务算法,应用于智能对话场景,服务于企业端客户,根据用户输入的文本数据,通过大语言模型生成符合用户需求的文本、代码等内容。 

2024年4月,DeepSeek大语言模型算法备案通过。

开发商

北京深度求索人工智能基础技术研究有限公司

备案号

网信算备110108970550101240011号

算法原理

DeepSeek 大语言模型系以 Transformer 架构为基础,自主研发的深度神经网络模型。模型基于注意力机制,通过海量语料数据进行预训练,并经过监督微调、人类反馈的强化学习等进行对齐,构建形成深度神经网络,并增加审核、过滤等安全机制,使算法模型部署后能够根据人类的指令或者提示,实现语义分析、计算推理、问答对话、篇章生成、代码编写等任务。