DeepSeek R1入门指南
导读
大家好,很高兴又和大家见面啦!!!
在当今人工智能技术日新月异的时代,大模型如雨后春笋般不断涌现,彻底改变了我们的生活与工作方式,为我们带来了前所未有的便利与惊喜。在众多大模型中,国产的 DeepSeek R1 凭借其卓越的推理能力以及丰富多元的功能,脱颖而出,吸引了无数目光。
在前面的内容中,我们已经完成了R1的本地部署、认识了R1、学会了如何选择适合自己的AI语言大模型。在今天的内容中,我们将会继续学习我们应该如何使用R1。下面我们直接进入今天的正题!!!
一、R1的四种使用方式
我们在使用R1时,总共有四种方式:
- 访问网页版
- 手机端 APP
- API 开放平台
- 私有化部署
下面我们就来看一下如何通过这4种方式来使用R1;
1.1 网页版
首先使用DeepSeek R1最简单的方法——访问网页版https://chat.deepseek.com/ 。
在进入网址后我们会看到下面的登录界面:
这里我们可以直接通过手机号进行注册登录:
在完成注册登录后,我们就可以免费进行使用了。
这种使用方式适合深度学习工作,但是要记住在使用时一定得选中深度思考R1,这样我们使用的就是满血版的R1了。
1.2 APP
第二种使用方式就是手机端 APP,可以通过扫码下载,或者在应用商店搜索安装。
上图就是APP的下载二维码,有需要的朋友可以扫码下载。这种使用方式的好处是能随时随地打开,同样免费注册使用。
1.3 API开放平台
第三种方式就是API 开放平台:平台网址是https://platform.deepseek.com/sign_in ,供开发者使用,根据输入 token 总数计量计费。
上图就是API 平台的登录页面,我们在完成注册并登录后就可以进入主页获取相关信息:
在主页中我们可以看到每百万次输入与输出的token所需要的费用。如果我们是第一次调用API,那我们可以通过接口文档获取使用方式:
这里我们可以看到首次调用API的方式,以及模型价格等诸多内容的介绍,这里我们看一下如何通过Python调用API:
# 提示信息:在运行此代码前,请先安装 OpenAI SDK,可在命令行中执行 `pip3 install openai` 来完成安装
# Please install OpenAI SDK first: `pip3 install openai`
# 从 openai 库中导入 OpenAI 类,这个类用于创建与 OpenAI 服务交互的客户端对象
# 不过这里会尝试将其用于 DeepSeek API 的调用,可能存在兼容性问题
from openai import OpenAI
# 创建一个 OpenAI 客户端实例
# api_key 参数需要填入你从 DeepSeek 平台获取的 API 密钥,此处 <DeepSeek API Key> 需替换为实际密钥
# base_url 参数指定了 API 请求的基础地址,这里设置为 DeepSeek 的 API 地址
client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")
# 调用客户端的 chat.completions.create 方法,向 DeepSeek 的聊天模型发送请求以获取回复
response = client.chat.completions.create(
# 指定要使用的模型,这里使用的是 DeepSeek 的聊天模型 deepseek - chat
# 通过指定 model='deepseek-chat' 即可调用 DeepSeek-V3
# 通过指定 model='deepseek-reasoner',即可调用 DeepSeek-R1
model="deepseek-chat",
# messages 参数是一个列表,包含了与模型交互的消息序列
messages=[
# 第一条消息的角色为 "system",用于向模型提供一些系统级别的指令或设定
# 这里告知模型其扮演的角色是一个乐于助人的助手
{"role": "system", "content": "You are a helpful assistant"},
# 第二条消息的角色为 "user",代表用户向模型提出的问题或请求
# 这里用户发送了一句 "Hello"
{"role": "user", "content": "Hello"},
],
# stream 参数设置为 False,表示不使用流式响应
# 即等待服务器返回完整的结果后再进行处理
stream=False
)
# 从响应结果中提取模型回复的消息内容并打印输出
# response.choices 是一个包含多个可能回复的列表,通常取第一个回复
# .message.content 则是具体的回复文本
print(response.choices[0].message.content)
注意,上述代码不能够直接使用,这里只是在文档中获取到的Python调用API的方式,我们在使用上述代码前,需要先创建一个API密匙,然后再使用,具体的操作方式在后续的篇章中会进行介绍,这里我就不再展开,有兴趣的朋友可以持续关注我的博客内容。
1.4 私有化部署
最后对于我们个人而言最方便的使用方式就是——私有化部署:
- 通过 Ollama/vLLM 等推理框架进行本地部署,硬件和技术要求较高,但能享受个性化更安全的服务。
前面我们已经介绍了通过Ollama进行本地私有化部署,这里我就不再赘述,有需要的朋友可以回顾【DeepSeek R1的本地部署】的相关内容。
二、界面功能与使用模式
2.1 界面功能
手机版与网页版的页面稍有差距,但整体的功能是大差不差的,这里我展示一下网页版的界面功能:
可以我们需要重点关注的是其使用模式,下面我们就来详细介绍一下;
2.2 使用模式
DeepSeek 三种使用模式的特点及使用场景:
2.2.1 深度思考(R1)
特点:
- 调用复杂推理能力,可对复杂问题进行深度逻辑分析。
- 基于模型内部知识库(非实时),依靠模型预训练所积累的知识作答,但这些知识并非实时更新。
- 生成结构化分析,给出的回答具有清晰的结构和条理。
使用场景:
- 适用于需要逻辑推演和多角度分析的问题,如复杂的数学证明、商业策略分析、深度学术问题探讨等。
2.2.2 联网搜索
特点:
- 实时访问互联网最新信息,能够获取当下最新的资讯。
- 整合外部数据源结果,综合多个网络来源的数据进行回答。
- 可能附带来源引用,在回答中注明信息的出处,增加可信度。
使用场景:
- 适用于依赖时效性或模型知识库外的事件,例如查询最新的新闻事件、体育赛事结果、当下的科技进展等。
2.2.3 默认模式(两者都不选)
特点:
- 快速生成简洁回答,响应速度快,答案简洁明了。
- 依赖模型预训练知识(可能过时),依据模型训练时所学到的知识回答,这些知识可能无法涵盖最新的情况。
- 无额外扩展,不会进行过多的拓展和延伸。
使用场景:
- 适用于简单事实确认或常识性问题,比如询问常见的历史事件发生时间、简单的数学运算、日常生活常识等。
三、瓶颈
这个页面相信用过的朋友已经见怪不怪了,没错这就是当前DeepSeek所遇到的最大的瓶颈——服务器繁忙。
3.1 原因分析
随着DeepSeek的逐渐火热,造成其服务器繁忙可能的原因大致有以下几点:
- 用户流量过大:使用 DeepSeek 的用户数量过多,超出了服务器的承载能力。
- 技术性能瓶颈:服务器本身的技术性能存在局限,无法处理过多的请求。
- 外部恶意攻击:受到来自外部的恶意网络攻击,影响了服务器的正常运行。
- 服务维护与限制:可能正在进行服务器维护,或者存在某些服务限制导致部分用户无法正常访问。
3.2 解决方式
针对服务器繁忙问题,我们有四种解决办法:
- 错峰使用:建议避开白天的使用高峰期,选择用户流量较少的时间段来使用 DeepSeek。
- 本地部署:通过在本地进行模型部署,减少对服务器的依赖,从而降低延迟并提升响应速度。
- 使用第三方平台:访问支持 DeepSeek 模型的第三方平台,借助这些平台的资源和服务来满足需求。
- 多刷新几次:通过多次刷新页面,尝试重新连接服务器,以获取服务。
不过要注意的以下几点:
- 本地部署的方式获取的是蒸馏版,并不是满血的R1。因此在深度思考上的能力相比于满血R1会弱一些,并且本地部署的方式很吃电脑硬件配置。就比如我自己的电脑属于比较老旧的,我这是16年买的笔记本,现在这配置,只能够带得动1.5b的版本,因此要使用满血R1的话不建议采用本地部署的方式。
- 错峰使用与多次刷新都可以体验到满血的R1,但是体验感不会太好。因为很容易遇到服务器繁忙的问题。
- 通过第三方平台来访问,整体的流畅性会大大提升,目前很多平台都有免费体验的名额,不过要想长久使用,肯定还是需要花钱购买的。(在后面的篇章中,我会介绍一下如何在其它平台使用R1)
四、R1 的使用技巧
4.1 提示词的设计
R1作为推理型模型,更适合处理开放性的逻辑性问题,因此我们在设计提示词时,语言越是自然,R1的回复效果越好。
在上一篇中我们已经介绍了推理型模型与通用型模型这两种模型的提示词的差异,并介绍了在不同场景下如何设计提示词,这里我们再回顾以下:
- 决策需求:
- 特点:需权衡不同选项,评估风险,进而选择最优解。
- 需求表达公式:$目标 + 选项 + 评估标准$。
- 提示语技巧:提供明确选项、评估标准和目标,以便模型基于量化分析给出决策建议。
- 分析需求:
- 特点:需要深度理解数据或信息,发现其中模式或因果关系。
- 需求表达公式:$问题 + 数据 / 信息 + 分析方法$。
- 提示语技巧:给出数据、分析问题和指定分析方法,引导模型深度挖掘数据信息、发现模式和因果关系。
- 创造性需求:
- 特点:要生成新颖内容,如文本、设计或方案等。
- 需求表达公式:$主题 + 风格 + 约束 + 创新方向$。
- 提示语技巧:明确主题、风格、约束条件和创新方向,让模型生成新颖且符合要求的内容。
- 验证需求:
- 特点:需检查逻辑自洽性、数据可靠性或方案可行性。
- 需求表达公式:$结论 / 方案 + 验证方法 + 风险点$。
- 提示语技巧:给出结论或方案、验证方法和需关注的风险点,使模型检查逻辑和数据的可靠性。
- 执行需求:
- 特点:需完成具体操作,如代码计算、流程执行等。
- 需求表达公式:$任务 + 步骤约束 + 输出格式$。
- 提示语技巧:清晰描述任务、步骤约束和输出格式,确保模型准确完成具体操作。
4.2 回答优化与验证
4.2.1 如何优化回答
当我们对 R1 给出的回答不满意时,我们可以通过以下方式来优化回答:
- 补充场景信息:
- 每次迭代更新时补充 1 - 2 个信息点,尤其可以补充问题的场景信息。通过提供更多背景和细节,帮助 DeepSeek 更好地理解问题,从而生成更准确、更贴合需求的回答。例如,在询问旅游相关问题时,可以补充自己的预算、偏好的旅行方式等场景信息。
- 约束输出形式:
- 对文本形式进行要求或者限制内容字数。比如,可以补充要求输出表格,或者规定回答的字数范围。这样能使 DeepSeek 的回答更符合特定的格式要求,便于阅读和使用。例如,要求以表格形式列出不同编程语言的特点。
- 结构化拆分:
- 将复杂问题进行拆分,便于 DeepSeek 对每个问题进行深度思考。把一个复杂的综合性问题分解成多个简单的子问题,有助于模型更清晰地分析和处理,提高回答的质量和深度。比如,对于 “如何提升企业的市场竞争力” 这样的复杂问题,可以拆分为 “产品方面如何改进”“营销策略有哪些”“客户服务怎样优化” 等子问题。
4.2.2 如何验证回答
当我们对其回答产生疑问时,我们则可采用以下方式进行验证:
- 假设角色身份:
- 假设 DeepSeek 是某个角色,再次询问其回答。通过赋予模型特定的角色身份,观察其回答是否符合该角色的特点和逻辑,以此来验证回答的合理性。例如,假设 DeepSeek 是一位资深的行业专家,然后再次询问某个专业问题,看其回答是否具备专业性和权威性。
- 反驳验证:
- 用相反结论要求 DeepSeek 论证,以此来验证之前的回答。提出与原回答相反的结论,让模型进行论证,如果模型不能合理地支持相反结论,那么原回答的可信度就相对较高;反之,则可能需要重新审视原回答。比如,原回答认为 “某种产品在市场上有很大潜力”,可以要求模型论证 “这种产品在市场上没有潜力”,看其论证过程和理由。
4.3 应用场景
我们在使用 R1 时,可以通过 R1 实现很多事情,这里我简单的例举几个:
- 内容创作助手:3步打造精美长图文
- 专属智慧顾问:4步拥有个人知识库
- 计划制定神器:1键生成Excel表格
4.3.1 内容创作
通过 R1 我们可以实现一些内容的创作,如小红书图文创作。利用 R1 三步生成长图文以用于小红书内容创作的方法,具体如下:
- 第一步:输入角色 + 场景 + 需求 + 适配小红书。
- 第二步:补充要求生成可运行的HTML代码。示例界面中展示了DeepSeek回复的一段小红书风格养生直发的HTML代码内容。
- 第三步:保存代码至.html文件后流量器打开并截图。
- 具体步骤:
- 新建.txt文件的记事本
- 打开记事本,将代码复制并保存
- 修改文件名为.html
- 浏览器运行并截图保存
此时我们已经完成了记事本的创建、代码的复制与保存工作,之后我们只需要将.txt修改为.html后运行即可获取生成的图文信息:
之后我们通过F12调出开发者工具并切换至手机调试模式(Ctrl+Shift+M)然后截图保存为竖版长图即可,图片建议尺寸:1080x1920(小红书首图最佳比例)
此时我们就获得了一份小红书的图文内容。
4.3.2 智慧顾问
通过4步操作利用DeepSeek打造个人知识库,将其变为专属智慧顾问的方法,具体步骤如下:
- 第一步(STEP1)
从官网开放平台获取DeepSeek的API。
- 第二步(STEP2)
下载开源AI应用AnythingLLM。
- 第三步(STEP3)
打开AnythingLLM,点击设置,选择DeepSeek并输入密钥。
- 第四步(STEP4)
打开工作区,尽情上传各种格式的资料,个性化知识库诞生。
4.3.3 计划定制
R1 可以帮助我们定制各种计划,包括旅游出行和健身学习等场景,DeepSeek在制定计划上表现出以下3个特征:
- 更贴合场景:具备完善的中文语境,能够实时接入交通、价格等信息。这意味着在制定计划时,尤其是旅游计划,它能充分考虑实际的交通状况和价格因素,给出更符合现实情况的方案。
- 计划更精细:DeepSeek制定的计划并非简单地按日期规划,而是可以精确到分钟。这一特性使得计划更加细致、可操作性强,能满足用户对时间安排的精准需求。
- 统计更完善:不仅能够发送Excel表格,还预设了表格的公式和统计功能,便于后续使用。这为用户在整理和分析计划数据时提供了极大的便利,例如在统计旅游开销、健身进度等方面都非常实用。
当然,R1 的功能还有很多,这里我就不再展开介绍。R1 本身所具备的这些强大的功能,可以帮助我们完成各式各样的工作,大大提高我们的工作效率,更深层次的拓展我们的知识面与认知。
结语
在今天的内容中我们介绍了个人使用R1的相关内容:
- 四种使用方式:
- 网页版登录
- APP登录
- 开放平台API调用
- 私有化本地部署
- 三种使用模式
- 深度思考(R1)
- 适用于需要逻辑推演和多角度分析的问题,如复杂的数学证明、商业策略分析、深度学术问题探讨等。
- 联网搜索
- 适用于依赖时效性或模型知识库外的事件,例如查询最新的新闻事件、体育赛事结果、当下的科技进展等。
- 默认模式(两者都不选)
- 适用于简单事实确认或常识性问题,比如询问常见的历史事件发生时间、简单的数学运算、日常生活常识等。
- 瓶颈及其原因分析
- 用户流量过大:使用 DeepSeek 的用户数量过多,超出了服务器的承载能力。
- 技术性能瓶颈:服务器本身的技术性能存在局限,无法处理过多的请求。
- 外部恶意攻击:受到来自外部的恶意网络攻击,影响了服务器的正常运行。
- 服务维护与限制:可能正在进行服务器维护,或者存在某些服务限制导致部分用户无法正常访问。
- 瓶颈解决方式
- 错峰使用:建议避开白天的使用高峰期,选择用户流量较少的时间段来使用 DeepSeek。
- 本地部署:通过在本地进行模型部署,减少对服务器的依赖,从而降低延迟并提升响应速度。
- 使用第三方平台:访问支持 DeepSeek 模型的第三方平台,借助这些平台的资源和服务来满足需求。
- 多刷新几次:通过多次刷新页面,尝试重新连接服务器,以获取服务。
- 提示词设计技巧
- 回答的优化
- 补充场景信息: 每次迭代更新时补充 1 - 2 个信息点,尤其可以补充问题的场景信息。
- 约束输出形式:对文本形式进行要求或者限制内容字数。
- 结构化拆分:将复杂问题进行拆分,便于 DeepSeek 对每个问题进行深度思考。
- 回答的验证
- 假设角色身份:假设 DeepSeek 是某个角色,再次询问其回答。
- 反驳验证:用相反结论要求 DeepSeek 论证,以此来验证之前的回答。
- 应用场景
- 内容创作:可以生成类似于小红书图文的内容
- 智慧顾问:可以通过AnythingLLM与R1创建自己的个人知识库
- 计划制定:可以定制包括但不限于旅游、学习、健身等场景下的计划
R1 的功能十分强大,能够用好 R1 ,就能帮助我们大幅度提高日常生活中的工作效率,让我们的生活更加便捷!!!
今天的内容到这里就全部结束了,如果大家喜欢博主的内容,可以点赞、收藏加评论支持一下博主,当然也可以将博主的内容转发给你身边需要的朋友。最后感谢各位朋友的支持,咱们下一篇再见!!!