【人工智能】要学会DeepSeek R1，一定得知道的几件事……

蒙奇D索隆

发布于 2025-02-13 09:13:27

900

文章被收录于专栏：蒙奇D索隆的学习笔记蒙奇D索隆的学习笔记

DeepSeek R1入门指南

导读

大家好，很高兴又和大家见面啦！！！

在上一篇内容中我们了解了什么是 DeepSeek ？什么是 DeepSeek-R1 ？以及DeepSeek-R1 能做什么？现在我们先简单的回顾一下这三个问题：

什么是DeepSeek？

DeepSeek 即深度求索，既是一家人工智能公司，也是其一系列人工智能产品的名称。

什么是DeepSeek-R1？

DeepSeek-R1 是幻方量化旗下大模型公司DeepSeek研发的首代开源推理大型语言模型。

DeepSeek-R1 能够做什么？

R1 直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景；
支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。

不知道有没有朋友会产生一个疑问——为什么 R1 能这么牛？它是怎么做到的？

要解决这个问题，我们就必须要了解一下大语言模型的相关知识点，下面我们就来一起看一下什么是大语言模型！！！

一、大语言模型

1.1 定义

大语言模型（LLM）是一种基于深度学习的人工智能模型，它基于海量文本数据，借助Transformer等架构进行训练，参数规模庞大。具备对自然语言的理解、生成、知识问答、推理等能力，可处理多种自然语言相关任务。

大语言模型属于人工智能中机器学习与深度学习领域的知识点，是在深度学习技术基础上，通过对大规模文本数据进行无监督或自监督学习训练而成的语言模型，涉及到神经网络架构（如Transformer）、优化算法、海量数据处理等多方面知识与技术。

1.2 分类

大语言模型按功能和应用侧重点划分，可分为以下几类：

通用型大语言模型：具备广泛语言处理能力，涵盖文本生成、问答、翻译等多种任务。
推理型大语言模型：擅长逻辑推理，如数学计算、代码推理和复杂问题解决。
对话型大语言模型：专注于对话交互，能生成自然流畅回复，模拟人类对话。
领域专用型大语言模型：针对特定领域，如医疗、金融、法律，利用领域数据训练，提供专业知识和服务。

我们现在正在学习的 DeepSeek R1 就属于推理型大语言模型。具体表现如下：

从训练目标角度：其专注于增强逻辑推理能力，旨在让模型在面对复杂问题时，能够进行多步推理，给出包含中间推理步骤的答案，而不仅仅是简单地生成文本。
从技术实现角度：采用强化学习与监督微调等技术进行多阶段训练。例如DeepSeek R1首先使用少量高质量的长链思维数据对DeepSeek-V3-Base模型进行微调，然后在RL收敛后，通过拒绝采样生成新的SFT数据，并结合来自DeepSeek-V3的数据进行重训练。
从应用场景角度：在数学问题解决、代码生成等需要深度推理的任务上表现出色，可有效处理那些需要复杂中间推理步骤的问题。

现在可能又有朋友要问了，什么是推理型大语言模型？它和其它的大语言模型又有哪些区别呢？下面我们就来探讨一下这个问题；

二、推理型大语言模型

2.1 定义

推理型大语言模型是一类基于大规模文本数据训练的深度学习模型，以Transformer架构为基础，在拥有语言理解与生成能力的同时，经特殊优化和训练，显著强化逻辑推理功能，能够依据输入的信息和自身存储的知识，运用逻辑分析、演绎、归纳等方式，对复杂问题进行多步骤推理，进而得出合理且有逻辑依据的结论，广泛应用于数学计算、逻辑判断、科学推理、代码生成等需要深度推理的任务场景。

非推理型大语言模型是基于大规模文本数据训练的人工智能模型，运用深度学习技术，具备自然语言的理解和生成能力，可处理如文本摘要、语言翻译、文本生成等任务，但在复杂逻辑推理、问题多步推导等方面能力较弱，主要侧重于一般性的语言处理而非深度推理。

从两者大语言模型的定义我们可以初步了解到：

推理型大语言模型可以应用于深度推理的任务场景
非推理型大语言模型可以应用于一般性的语言处理任务场景

2.2 差异化比较

为了更好的了解到二者的区别，下面我们从四个维度来进行分析：

2.2.1 优势领域

推理型大语言模型：在数学领域，能进行复杂计算和定理证明；在科学研究中，可辅助假设推导和实验结果分析；用于代码生成时，能处理复杂逻辑的代码编写与调试。
非推理型大语言模型：在创意写作上，擅长生成故事、诗歌等；在文本摘要方面，可快速提取关键信息；在语言翻译领域，能实现自然流畅的不同语言转换。

2.2.2 劣势邻域

推理型大语言模型：在创意写作的情感细腻度和独特风格表现上较为欠缺，难以自然地营造丰富情感氛围；处理简单文本生成任务时，可能因过度推理导致效率低下，且在处理无逻辑规律的文本生成任务时，表现不如非推理型模型。
非推理型大语言模型：在处理复杂数学问题、逻辑推理、科学假设验证等需要深度逻辑分析的任务时能力不足，难以得出严谨准确的结论；对需要多步骤推理和深度理解的任务处理效果不佳，无法像推理型模型那样进行系统的推导。

2.2.3 性能本质

推理型大语言模型：性能本质基于对大量知识的深度理解与逻辑推导能力。它通过学习海量文本数据中的逻辑关系、语义信息等，构建起强大的知识体系。在面对问题时，能够运用这些知识进行分析、判断和推理，从已知信息中推导出未知结论，侧重于解决复杂的、需要多步思考的逻辑问题。
非推理型大语言模型：性能本质在于对自然语言模式的学习和模仿。通过对大规模文本的统计分析，掌握语言的语法结构、词汇搭配、语义倾向等模式。在处理任务时，依据这些学习到的模式生成符合语言习惯的文本，更擅长完成文本生成、语言转换、信息提取等基于语言模式匹配和生成的任务，而非深度的逻辑推理。

2.2.4 强弱判断

推理型大语言模型：强于复杂逻辑推理任务，如数学证明、科学假设验证；在需要多步推理和深度分析的场景，如法律案例分析、代码bug推理中表现出色。但弱于创意写作的情感表达、日常文本的快速生成，以及无需推理的简单文本任务。
非推理型大语言模型：擅长创意文本生成，如故事创作、诗歌写作；在语言翻译、文本摘要和简单问答上表现好。不过，面对复杂逻辑推理、专业领域深度问题求解时能力不足。

结语

在今天的内容中我们从3个问题出发，进一步加强了对 R1 的认知：

什么是大语言模型？

大语言模型（LLM）是一种基于深度学习的人工智能模型，它基于海量文本数据，借助Transformer等架构进行训练，参数规模庞大。具备对自然语言的理解、生成、知识问答、推理等能力，可处理多种自然语言相关任务。

什么是推理型大语言模型？什么是非推理型大语言模型？

推理型大语言模型是指能够在传统的大语言模型基础上，强化推理、逻辑分析和决策能力的模型。它们通常具备额外的技术，比如强化学习、神经符号推理、元学习等，来增强其推理和问题解决能力。
非推理型大语言模型是是基于大规模文本数据训练的人工智能模型。此类模型通常通过对大量文本数据的训练，掌握语言规律并能够生成合适的内容，但缺乏像推理模型那样复杂的推理和决策能力。

推理型与非推理型大语言模型之间的差异？

两种类型的大语言模型在优势邻域、劣势邻域、性能本质以及强弱判断这四个维度下的差异如下所示：

维度	推理模型	通用模型
优势领域	数学推导、逻辑分析、代码生成、复杂问题拆解	文本生成、创意写作、多轮对话、开放性问答
劣势领域	发散性任务（如诗歌创作）	需要严格逻辑链的任务（如数学证明）
性能本质	专精于逻辑密度高的任务	擅长多样性高的任务
强弱判断	并非全面更强，仅在其训练目标领域显著优于通用模型	通用场景更灵活，但专项任务需依赖提示语补偿能力