极速部署个人计算机 DeepSeek-R1 推理模型

苏奕嘉

发布于 2025-07-14 18:32:32

1720

引言

2025的春节，国内外的科技圈子，甚至全民热话，都是深度求索的 DeepSeek-R1 模型。

当在家里的大舅哥突然拿出手机，给我播放了“美国决定全面严格审查 DeepSeek”和“中国科技公司 DeepSeek 遭国外有组织的进行大规模 DDoS 攻击”的新闻，并问我 DeepSeek 是个什么东西时，我意识到深度求索的 DeepSeek-R1 模型已成为中国科技历史上的一笔浓墨重彩的里程碑事件。

DeepSeek 主要解决了什么问题？

DeepSeek-R1 就是个啥都懂的国产AI大脑，既能看文字图片又能听声音，还能自己琢磨事儿不犯原则性错误。最牛的是它不用超级电脑，千把块的破手机就能跑，从帮医生搞研究到帮老外翻译方言全都能干，直接让中国AI技术和欧美掰手腕了。

从腊月二十九到大年初一，三天时间我尽可能全面、仔细的盘点和研究了一遍 DeepSeek-R1 模型，本篇就简明扼要的给大家来一篇个人计算机快速部署 DeepSeek-R1 推理模型的教程，网络好的话十分钟搞定~

前期准备

本次演示，使用了以下基础环境：

电脑：Mac M1 16GB（如是 Win/Linux 和 N/A 卡，也可以照搬）

部署运行框架：Ollama

部署模型：DeepSeek-R1-7b/8b

前端展示：Open-Web

关于 DeepSeek-R1 和 DeepSeek-R1-7b、DeepSeek-R1-8b 的区别，简单来说就是：

1. DeepSeek-R1：基础款大模型，参数巨多（比如千亿级），像全能学霸，但需要高性能服务器才能跑。
2. -7B/-8B：砍掉参数的轻量版（70亿/80亿参数），相当于“重点班特供版”，手机/普通电脑都能用，虽然没原版聪明但更接地气。
3. 核心区别：大模型干复杂活（比如搞科研），小模型做日常事（比如手机翻译），就像电脑和充电宝的关系——能力不同，但都挂着DeepSeek的牌子。

部署框架 Ollama 安装

1. 访问官网下载对应系统的安装包：https://ollama.com/download

2. 解压缩 Zip 包，安装 Ollama

3. 运行 Ollama 后，在置顶工具栏会出现 Ollama 的 Logo 图标

下载运行 DeepSeek-R1-7b/8b 模型

1. 访问 Ollama 的 DeepSeek-R1 依赖库地址：https://ollama.com/library/deepseek-r1

2. 选择 Tag：7b 或者 8b

3. 复制 Ollama 运行 DeepSeek-R1-7b/8b 的命令

4. 在终端命令行窗口执行复制的命令

这里下载速度与网络环境有很大关系，尽可能用一个稳定的网络环境下载运行

5. 校验模型是否部署成功

安装 Open-Web 可视化展示项目

只用命令行窗口进行沟通不太美观，我们引入一个可视化展示项目来完成前端展示。

Open-Web 可视化工具是一款开源的大模型前端可视化展示项目。

项目地址：https://github.com/open-webui/open-webui

提供了使用 Pip 安装和 Docker 运行安装的两种方案，这里为了避免环境问题导致的各种错误，建议使用 Docker 运行和部署该项目。本篇不做 Docker 安装部署的介绍，可至 DockerHub 官网（https://www.docker.com）下载

1. 访问项目，在 Readme 中有详细介绍

2. 我们在上一步已安装部署好 Ollama 框架，故此直接选择第一行命令即可：docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main