这个 GitHub 项目一周涨了 1.4 万星,我一开始以为又是 PPT 开源。
结果看完实测数据,有点离谱: 代码搜索结果从 1.7 万 token 压到 1400,答案几乎没变。
项目叫 Headroom,核心就干一件事:把代码搜索结果、日志、RAG 文档这些长上下文,先压缩一遍,再喂给 AI。
最狠的是它不是简单删内容,而是可逆压缩。原文本地还在,AI 真需要细节时可以再调回来,所以 Debug 能力不会直接被砍废。
几个关键点: 1. Token 最高能砍掉 92% 2. Claude Code / Codex / Cursor 都能 wrap 3. 不用大改代码,可以当代理跑 4. 数据本地处理,不走云端 5. Python 和 Node 都能装 6. 自动在 6 种压缩算法里选 这东西最适合三类人: 用 Claude / Codex 写代码,每月 token 账单肉疼的; 项目上下文太大,AI 动不动丢细节的; 做 RAG、多 Agent、代码搜索,想压成本又不想牺牲效果的。 以前大家优化 AI 编程,都是想办法换模型、换提示词、换工作流。
但真正被忽略的成本,可能是你每次都把一堆“AI 不一定需要完整阅读”的上下文原封不动塞进去。
Headroom 这类工具的价值就在这里: 不是让 AI 更聪明,而是让 AI 少读废话。 免费、本地、开源。 Token 费高的,可以重点看看。