Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >DeepSeek接入个人知识库,保姆级教程来了!

DeepSeek接入个人知识库,保姆级教程来了!

作者头像
Datawhale
发布于 2025-02-26 07:16:57
发布于 2025-02-26 07:16:57
2.4K10
代码可运行
举报
文章被收录于专栏:Datawhale专栏Datawhale专栏
运行总次数:0
代码可运行

作者:张龙斐,Datawhale鲸英助教

面向人群:计算机小白 

阅读时间:7分钟 

上次的《最全梳理:一文搞懂 RAG 技术的5种范式!》梳理了对 RAG 进行了一个完整的综述。这次带来 RAG 的小白应用教程:介绍如何通过 ragflow 框架把 DeepSeek 接入到自己的个人知识库中,当然其他模型也是类似,可以自由搭配。

先看效果: 

Image
Image

ragflow 简介:

RAGFlow 是一款基于深度文档理解的开源检索增强生成(Retrieval-Augmented Generation,RAG)引擎,旨在通过结合信息检索和生成式 AI 的优势,解决现有技术在数据处理和生成答案方面的挑战。 

作用

RAGFlow 广泛应用于需要动态生成内容且依赖外部知识库的场景,例如: 

  • 智能客服:实时从企业知识库中检索相关信息,为客户提供准确、个性化的解答。
  • 文档生成与报告分析:从多个数据源中检索信息并生成结构化的文档或摘要,适合大规模内容管理。
  • 辅助诊断:医疗专业人员可以通过 RAGFlow 快速查找相关医学文献和病例资料,为诊断和治疗提供参考。
  • 文献综述:帮助学生和研究人员快速定位和分析相关的学术文献,高效完成文献综述的撰写。
  • 新闻报道与投资分析:记者和金融机构可以利用 RAGFlow 整合和提炼大量素材,生成新闻稿件或投资分析报告。

优势

  1. 深度文档理解:能够从复杂格式的非结构化数据中精准提取知识,支持多种文档格式(如 Word、PPT、Excel、PDF 等),并自动识别文档布局。
  2. 降低幻觉风险:提供清晰的关键引用来源,支持文本分块的可视化和人工干预,确保生成答案有据可依。
  3. 兼容异构数据源:无缝处理多种数据格式,整合不同来源的数据,为用户提供一站式的数据处理和问答体验。
  4. 自动化工作流:支持从个人应用到超大型企业的各类生态系统,提供易用的 API,便于快速集成到各类业务系统。
  5. 高效性与成本优化:通过动态优化流程,减少不必要的计算和查询次数,降低运行成本。
  6. 精准性与可靠性:检索和生成环节相辅相成,确保最终结果的准确性和可靠性。

RAGFlow 的这些特性和优势使其在信息检索和内容生成领域具有广泛的应用前景和显著的竞争力。 

我的理解呢,ragflow的意义在于它把原本复杂的rag系统开发,处理成了零代码开发模式,方便非计算机背景的人也可以进行rag系统的搭建和维护,而且融入了类似dify的强大的工作流编排功能。 

ragflow 本地 windows 部署

配置要求:ragflow是一个相当“重”的项目,如果你的电脑不满足以下条件,请不要随意尝试 

Image
Image

一、软件配置安装

首先我们需要安装好 docker 软件 

https://www.runoob.com/docker/windows-docker-install.html

安装好 docker 后启动即可,不用登陆不用设置任何东西,一路跳过。 

这里我们需要配置 docker 镜像源 

Image
Image
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
{
  "registry-mirrors": [
    "https://registry.docker-cn.com",
    "http://hub-mirror.c.163.com",
    "https://docker.mirrors.ustc.edu.cn"
  ],
  "insecure-registries": [],
  "debug": false,
  "experimental": false,
  "features": {
    "buildkit": true
  },
  "builder": {
    "gc": {
      "enabled": true,
      "defaultKeepStorage": "20GB"
    }
  }
}

上方代码粘贴替换完毕后点击右下角 

Image
Image

到这里我们的 docker 就配置好了 

然后我们需要安装 git:https://cloud.tencent.com/developer/article/2099150 

最后我们需要安装 vscode:https://zhuanlan.zhihu.com/p/264785441 

二、安装 ragflow

设置安装路径

在 c 盘之外的地方打开一个文件夹用来安装 ragflow,鼠标右键,点击 open Git Bash here 

输入命令: 

git clone https://github.com/infiniflow/ragflow.git

点击回车就可以看到多了一个文件夹 ragflow 

由于默认配置版本是没有 embedding 模型的,所以我们修改配置为完整版。使用 vscode 打开 .env 文件,修改第 84 行和第 87 行,ctrl+s 保存文件。 

Image
Image

拉取 docker 镜像

接下来我们开始部署 docker 镜像,按住 win+R 键,输入 powershell,点击回车。之后输入 cd+刚刚下载的ragflow文件夹路径,我这里是cd D:\demo\ragflow\docker按回车,输入docker compose -f docker-compose.yml up -d按回车。之后可以看到正在使用 docker 加载镜像,稍等一会儿加载完毕即可。 

大概 15 分钟后镜像加载完毕就部署完毕了。最后我们输入docker logs -f ragflow-server,出现 RAGFLOW 字体就代表后端服务启动成功了。 

Image
Image
Image
Image
Image
Image

之后我们在浏览器地址栏输入:localhost:80即可打开ragflow登录页面。登录页面可以随便输入一个邮箱账号(随便编一个符合邮箱格式的就可以),全部是保存在你本地电脑上的,不用担心数据泄露。但是要注意第一个注册的默认是管理员,所以还是要注意保存一下你注册的邮箱信息。之后点击登录就可以使用ragflow了。 

Image
Image
Image
Image

三、简易使用教程

首先我们配置一下 deepseek 模型服务,api-key 可以从 https://platform.deepseek.com/api_key 申请获取(官网已经恢复充值)。 

之后我们上传资料创建一个本地知识库就可以啦。可以看到上传的资料支持多种格式,扫描版的 pdf 文档也是可以的。 

Image
Image

上传文件之后需要等待文档解析完成,可以看到文档解析的效果还是不错的 

Image
Image

创建对话助理后,就可以对话啦,注意在模型设置里把模型替换为 deepseek-chat 

Image
Image

四、启动与关闭 ragflow 程序:

关闭 ragflow 程序:

关掉 powershell 窗口,退出 docker 进程即可。 

Image
Image

启动 ragflow 程序:

打开 docker 软件,按下 win+R 打开 powershell,输入docker logs -f ragflow-server回车,就启动了后端服务了。!!检查一下 docker 软件,看一下 ragflow 是否全部启动,也就是下图中的几个服务全是运行状态: 

Image
Image

如果都在运行中,此时可以在浏览器输入localhost:80即可启动前端界面,愉快的使用 ragflow 啦! 

本教程主要参考以下两篇官方文档撰写:

1. https://github.com/infiniflow/ragflow?tab=readme-ov-file 

2. https://ragflow.io/docs/dev/ 

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Datawhale 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
已关注大佬,是否可以给我这开源项目 https://github.com/youzeliang/rdb 给一个star
已关注大佬,是否可以给我这开源项目 https://github.com/youzeliang/rdb 给一个star
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
深度解锁AI私有知识库:用 DeepSeek 和 RAGFlow 打造企业级智能平台
时间过的真快呀,又是一周结束了,最近AI和机器人的热度越来越高,能看到相关话题的文章越来越多。我在想,作为一个普通打工仔,我们能做什么,除了不断问AI生成答案,然后问完解决完就扔在脑后?想必不是长久之计,所以将知识沉淀,搭建一个私人知识库,来辅助自己建立脑中的知识库才是最重要的,今天就来给大家介绍如何利用开源项目打造一款私有AI知识库!
希里安
2025/03/31
7610
深度解锁AI私有知识库:用 DeepSeek 和 RAGFlow 打造企业级智能平台
dify v0.15.3外挂ragflow知识库,保姆级教程来了!
上一次我们学习了如何部署ragflow,本次我们学习如何使用ragflow+dify搭建本地问答系统。
Datawhale
2025/04/02
2.8K0
dify v0.15.3外挂ragflow知识库,保姆级教程来了!
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
LLM 本身只是一些 神经网络参数, 就拿 DeepSeek-R1 来讲,模型本身存储了 权重矩阵,以及 混合专家(MoE)架构, 实际运行起来需要行业级别的服务器配置, 消费级别的个人电脑不能直接运行,实际还涉及到硬件适配,需手动配置 CUDA/PyTorch 环境,编写分布式推理代码,处理量化与内存溢出问题
山河已无恙
2025/02/25
2.1K0
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
使用DeepSeek+RAG实现私人知识库
我使用包括 ChatGPT 在内的 AIGC 工具,回答 SAP 相关领域问题时,经常遇到大模型「一本正经的胡说八道」。这种现象的正式术语是大模型的幻觉现象。
编程小妖女
2025/02/07
27.5K17
使用DeepSeek+RAG实现私人知识库
DeepSeek搭建个人知识库教程
各位朋友,是不是经常被 AI 气得火冒三丈,恨不得把键盘给砸了?你让它查公司去年的财务数据,它却开始背诵经济学原理;你让它分析竞品的策略,它却大谈特谈马斯洛需求理论。我太能理解这种感受了,这就好比你花钱雇了个助理,结果这助理啥都不会,只会照搬百度百科的内容!
@派大星
2025/03/04
6430
DeepSeek搭建个人知识库教程
利用DeepSeek-R1构建简单的本地知识库
大家好,我是默语~👋😄 今天带来一篇超级干货、满满实操经验的长文,教你如何利用 DeepSeek-R1 构建简单的本地知识库,以及如何用 DeepSeek 搭配 Kimi 在2分钟内生成32页PPT!🔥💡
默 语
2025/02/18
1.5K0
利用DeepSeek-R1构建简单的本地知识库
详解几种常见本地大模型个人知识库工具部署、微调及对比选型(1)
这几年,各种新技术、新产品层出不穷,其中,大模型(Large Language Models)作为AI领域的颠覆性创新,凭借其在语言生成、理解及多任务适应上的卓越表现,迅速点燃了科技界的热情。从阿尔法狗的胜利到GPT系列的横空出世,大模型不仅展现了人工智能前所未有的创造力与洞察力,也预示着智能化转型的新纪元。然而,大模型的潜力要真正转化为生产力,实现从实验室到现实世界的平稳着陆,还需跨越理论到实践的鸿沟。
zhouzhou的奇妙编程
2024/06/11
21.5K0
LLMOps实战(一):DeepSeek+RAG 协同构建企业知识库全流程指南
首先解释下什么是 LLMOps,Large Language Model Operations是专注于大语言模型全生命周期管理的工程实践,涵盖从模型开发、部署、监控到持续优化的系统性流程。其核心目标是提升LLM应用的可靠性、效率与可控性,解决大模型在实际落地中的技术与管理挑战。
范赟鹏
2025/03/24
4.7K0
DeepSeek 全场景集成工具指南
DeepSeek 的爆火催生了丰富的生态工具矩阵。本指南精选 22+ 个实用工具,覆盖 6 大核心场景,通过模块化选型建议帮助开发者快速构建 AI 工作流。文末附部署路线图!特点:覆盖开发/办公/科研场景、支持主流技术栈、强化行业解决方案。
徐建国
2025/02/12
1.4K0
DeepSeek 全场景集成工具指南
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
❝清晨,我泡上一杯98年的咖啡,打开电脑,收到一条来自Doris用户的消息: "请问有 将doris数据库数据作为deepseek大模型的知识库的方法吗" "好滴,安排!" 于是,和这位Doris用户聊了聊,发现这类需求随着DeepSeek的爆火被无限放大了,但也确实是一个‌引申的机遇与挑战。 也罢,今天就来一探究竟,一起学习学习如何基于Doris+DeepSeek打造你的专属AI助手!
一臻数据
2025/02/26
1.1K1
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
【人工智能】如何借助DeepSeek R1打造个人知识库?
在当今信息爆炸的时代,知识和资料如潮水般涌来。如何对这些海量信息进行高效管理,确保在需要时能迅速检索并加以利用,成为了许多人亟待解决的问题。搭建个人知识库,无疑是应对这一挑战的绝佳方案。而DeepSeek作为一款强大的人工智能工具,为我们搭建个人知识库提供了便捷高效的途径。接下来,将为你详细介绍如何运用DeepSeek搭建属于自己的知识宝库。
蒙奇D索隆
2025/02/18
2.8K0
【人工智能】如何借助DeepSeek R1打造个人知识库?
RAGFlow-一款开源的RAG引擎
RAGFlow[1] 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
山行AI
2024/04/18
5.2K0
RAGFlow-一款开源的RAG引擎
47.3K star!这款开源RAG引擎真香!文档理解+精准检索+可视化干预,一站式搞定!
嗨,大家好,我是小华同学,关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法
小华同学ai
2025/04/01
4340
47.3K star!这款开源RAG引擎真香!文档理解+精准检索+可视化干预,一站式搞定!
HAI部署DeepSeek+AnythingLLM构建你的法律知识库
在日常中,我们会遇到不少法律问题。但是我们的知识又不是那么的专业,这个时候就需要一个产品来帮我们进行整合回答。在这篇文章开始之前各位可以了解一下腾讯云HAI平台和DeepSeek大模型。我的思路是通过知识库调用本地DeepSeek模型,从而实现知识问答。类似于在线查询的功能。
VyrnSynx
2025/02/04
1.7K0
使用DeepSeek搭建个人知识库
对于想要在本地或自托管环境中运行 LLM 的用户而言,Ollama 提供了一个无需 GPU、在 CPU 环境也可高效完成推理的轻量化 “本地推理” 方案。而要让 Ollama 真正 “接地气”,往往需要与其他开源项目进行配合——例如将文档、数据源或应用前端与 Ollama 打通,这便衍生出许多解决方案。
lyushine
2025/04/02
4020
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
以上方式在云端产品上实现 DeepSeek 的私有化部署,除此之外,也可以部署安装在本地机器上,如个人PC电脑、内网电脑等环境。
参谋带个长
2025/02/15
3.5K0
用腾讯ima+DeepSeek给你配一个Doris知识库(保姆级教程)
❝最近有几位Doris小伙伴反馈: "Doris的公众号文章很多,但有时一不留意,就找不着了!" "有没有一种方法,能把所有Doris的公众号文章集中起来,随时随地查询、问答、甚至能自动更新?" ..... "好滴,安排!" 答案是肯定滴。腾讯出品的AI工作台ima,搭配DeepSeek大模型,简直就是为公众号知识库量身定做的。 今天就把这套组合拳的使用方法分享给大家 👇
一臻数据
2025/04/18
3230
用腾讯ima+DeepSeek给你配一个Doris知识库(保姆级教程)
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
随着AI技术和知识管理的快速发展,Ragflow作为开源RAG(Retrieval-Augmented Generation)流程管理平台,再次迎来强劲升级——v0.19.0版本!本次更新覆盖了跨语言搜索、多语言环境适配、全新Agent组件、图像显示方式革新、集成领先AI模型等重磅功能,同时修复了大量细节问题,提升了开发者和用户体验的方方面面。本文将从核心新特性、功能优化、社区贡献、应用场景切入,深度剖析该版本升级亮点,带你全面了解Ragflow v0.19.0的技术魅力和未来价值!
福大大架构师每日一题
2025/05/26
1.2K0
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
手把手教你:Windows与Linux下Dify+DeepSeek实现ragflow构建企业知识库
在当今人工智能飞速发展的时代,大语言模型(LLMs)已经成为众多领域的核心技术驱动力。无论是在智能客服、智能写作,还是在数据分析、决策支持等方面,大语言模型都展现出了强大的能力和潜力。然而,随着数据安全和隐私保护意识的不断提高,越来越多的企业和开发者开始寻求本地化部署大语言模型的解决方案,以确保数据的安全性和可控性。
范赟鹏
2025/05/30
1.2K0
手把手教你:Windows与Linux下Dify+DeepSeek实现ragflow构建企业知识库
全网最全Doris+DeepSeek使用手册(客服/图表/PPT/贺岁诗)!学会了Doris熟练度提高90%【建议收藏】
❝2025注定是不凡的一年。 DeepSeek火爆出圈出国,即使春节期间,各位海内外的博主们也在马不停蹄地猛更,流量被疯狂放大! 一臻刚耍完,正巧赶上个节尾,就有不少臻友私信问 "有没有Doris+DeepSeek的玩法?" "好滴,安排!" 吭呲吭呲马不停蹄地翻阅了大大小小的DeepSeek爆文,实测总结了一些Doris+DeepSeek的玩法思路,欢迎大家一起来探究竟!
一臻数据
2025/02/05
6751
全网最全Doris+DeepSeek使用手册(客服/图表/PPT/贺岁诗)!学会了Doris熟练度提高90%【建议收藏】
推荐阅读
深度解锁AI私有知识库:用 DeepSeek 和 RAGFlow 打造企业级智能平台
7610
dify v0.15.3外挂ragflow知识库,保姆级教程来了!
2.8K0
基于 Deepseek LLM 本地知识库搭建开源方案(AnythingLLM、Cherry、Ragflow、Dify)认知
2.1K0
使用DeepSeek+RAG实现私人知识库
27.5K17
DeepSeek搭建个人知识库教程
6430
利用DeepSeek-R1构建简单的本地知识库
1.5K0
详解几种常见本地大模型个人知识库工具部署、微调及对比选型(1)
21.5K0
LLMOps实战(一):DeepSeek+RAG 协同构建企业知识库全流程指南
4.7K0
DeepSeek 全场景集成工具指南
1.4K0
3分钟!教会你用Doris+DeepSeek搭建RAG知识库(喂饭级教程)
1.1K1
【人工智能】如何借助DeepSeek R1打造个人知识库?
2.8K0
RAGFlow-一款开源的RAG引擎
5.2K0
47.3K star!这款开源RAG引擎真香!文档理解+精准检索+可视化干预,一站式搞定!
4340
HAI部署DeepSeek+AnythingLLM构建你的法律知识库
1.7K0
使用DeepSeek搭建个人知识库
4020
私有化搭建、本地知识库、可联网查询、具备RAG能力的私人DeepSeek
3.5K0
用腾讯ima+DeepSeek给你配一个Doris知识库(保姆级教程)
3230
ragflow v0.19.0震撼发布!跨语言搜索、全新Agent代码组件、图像直显功能全面升级!
1.2K0
手把手教你:Windows与Linux下Dify+DeepSeek实现ragflow构建企业知识库
1.2K0
全网最全Doris+DeepSeek使用手册(客服/图表/PPT/贺岁诗)!学会了Doris熟练度提高90%【建议收藏】
6751
相关推荐
深度解锁AI私有知识库:用 DeepSeek 和 RAGFlow 打造企业级智能平台
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验