
作为一名经常要处理大量信息的人,大家想必都有过这样的经历:
然后这些东西就静静地躺在那里,再也没有被看过。
我们的收藏夹、笔记软件、网盘里,堆满了各种「可能以后会用到」的资料,但真正需要的时候,要么搜不到,要么找到了也是一堆零散的碎片,根本无法串起来形成有用的知识。
更别说花时间手动整理了——整理笔记的时间往往比阅读时间还长,最后索性放弃。
最近发现了一个开源项目,彻底改变了我对知识管理的认知。它不是另一个笔记软件,而是一个让大模型自动帮你构建、维护、更新的个人知识库。

这个项目叫 LLM Wiki,基于 Andrej Karpathy 提出的 LLM Wiki 方法论,把传统的 RAG 思路完全颠覆了。

LLM Wiki 是一个跨平台的桌面应用,它的核心理念非常简单:把你的文档「编译」成一套结构化的 Wiki,知识只整理一次,之后持续更新维护。

和传统的 RAG 不同,传统 RAG 每次提问都要去翻原始文档,检索碎片文本,用完就忘;而 LLM Wiki 是先让 LLM 把文档内容彻底消化,提取实体、概念、关系,生成互相关联的 Wiki 页面,之后所有的问答都基于这个已经「编译好」的 Wiki 来做。
而且它是基于 Karpathy 的原始思想实现的,但做了大量的工程化增强,做成了一个真正能用的桌面应用。
1、两步思维链 Ingest
LLM Wiki 没有让 LLM 一边读一边写,而是把这个过程拆成了两个步骤:
第一步:分析 - LLM 先读取源文档,提取关键实体、概念、论点,分析和现有 Wiki 内容的联系,标记出可能的矛盾和知识空白,给出 Wiki 结构的建议。
第二步:生成 - 基于第一步的分析结果,LLM 生成 Wiki 页面,包括源摘要、实体页面、概念页面,自动建立交叉引用,更新 index.md、log.md、overview.md 等核心文件。
这种两步走的方式,比单步生成的质量高很多,而且它还加了 SHA256 增量缓存——源文件内容没变就直接跳过,既省 Token 又省时间。
2、四信号知识图谱
LLM Wiki 不只是简单的 Wiki 页面互链,它还构建了一个完整的知识图谱,用四个维度来计算页面之间的相关性权重:
然后基于这个图谱,项目用 Louvain 算法自动发现知识聚类——它能告诉你:「你收集的这些资料里,哪几个主题天然形成了一个知识域」。每个聚类还会有一个内聚度评分,低于 0.15 的会被标记为警告。
3、深度研究,自动填补知识空白
当知识图谱发现「知识空缺」时(比如某个概念只有一两篇引用),你可以直接触发 Deep Research 功能。
LLM 会先读取 overview.md 和 purpose.md 来理解你的研究方向,然后生成优化的搜索主题和查询语句,通过 Tavily API 进行网络搜索。
搜到的结果会自动回灌到 Wiki 里,LLM 会把这些新内容合成一个研究页面,建立和现有 Wiki 的交叉引用。整个过程你只需要点一下按钮,剩下的都交给 AI。
4、隐私安全
所有的 raw 资料和生成的 wiki 都保存在本地,完全隐私安全。
而且 Wiki 目录本身就是一个完整的 Obsidian vault,你可以随时用 Obsidian 打开进行二次创作和沉浸式阅读。
LLM Wiki 负责「生产知识」,Obsidian 负责「消费知识」,两者完美互补。
安装方式
方式一:下载预编译二进制(推荐)
直接去 GitHub Releases 页面下载对应平台的安装包:

方式二:从源码构建
如果你想自己编译,需要先安装:
然后执行:
git clone https://github.com/nashsu/llm_wiki.git
cd llm_wiki
npm install
npm run tauri dev # 开发模式运行
npm run tauri build # 生产环境构建Chrome 扩展安装
chrome://extensionsextension/ 目录编写 schema.md
schema.md 是 LLM Wiki 的核心配置文件,它告诉 LLM 如何提取知识:
# Knowledge Schema
## Categories
- **Finance**: 涵盖期权交易、对冲策略、CPA 财管考点。
- **Technology**: 涵盖前端技术 (WebGPU/Vite)、Python 实现、AI 编程。
- **Concepts**: 跨学科的核心理论与术语定义。
## Extraction Rules
1. 提取文档中的核心实体。
2. 识别并建立实体间的逻辑联系,使用 [[双括号]] 建立链接。
3. 如果发现文档内容与现有 Wiki 存在冲突或补充,请在笔记中注明。
## Output Template
- **Summary**: 核心观点。
- **Context**: 应用场景。
- **Technical/Formula**: 公式或代码片段。
- **Audit**: 需要进一步深度研究的空白点。LLM Wiki 不是一个花哨的概念,它是大模型知识管理从「临时检索」走向「长期记忆」的关键一步。它解决了传统 RAG 的几个核心痛点:
而 LLM Wiki 的思路是:编译一次,持续更新。人负责「看什么」,LLM 负责「怎么记」——这才是正儿八经的人机分工。
如果你也在为知识管理头疼,如果你也有一堆收藏了但没整理的资料,不妨试试 LLM Wiki。它可能会彻底改变你管理知识的方式。
GitHub:https://github.com/nashsu/llm_wiki