当前位置: 首页 > news >正文

RAG 是临时查资料,LLM Wiki 是让知识开始复利

RAG 是临时查资料,LLM Wiki 是让知识开始复利

1. 问题不是“选 RAG 还是选 Wiki”

在企业 Agent 落地时,一个很容易出现的问题是:

到底应该做 RAG,还是做 LLM Wiki?

如果你还没有读过 Karpathy 的 LLM Wiki 原文,可以先看我整理的中文翻译仓库:

  • 中文翻译仓库:huajiexiewenfeng/llm-wiki-cn

本文不重复翻译原文,而是基于 Karpathy 的 LLM Wiki 思路,继续讨论它和 RAG 在企业 Agent knowledge runtime 中的选型关系。

这个问题表面上是在选技术方案,实际上是在问另一个更底层的问题:

企业知识到底应该在什么时候被加工?

RAG 的答案是:用户提问时再加工。

Karpathy 式 LLM Wiki 的答案是:资料进入知识库时就开始加工,并且持续维护。

这两个方向不是简单替代关系。它们真正的差别,不在于有没有向量数据库,也不在于是不是 Markdown,而在于知识处理发生的阶段不同。

  • RAG 是 query-time retrieval。
  • LLM Wiki 是 ingest-time / maintenance-time synthesis。

RAG 更像临时查资料。

LLM Wiki 更像让知识开始复利。

2. 普通 RAG 的工作方式

普通 RAG 的典型流程是:

  1. 收集企业文档
  2. 文档解析和切分
  3. 建立关键词索引或向量索引
  4. 用户提问
  5. 系统检索相关 chunk
  6. LLM 基于检索结果生成答案

它解决了一个非常实际的问题:LLM 本身不知道企业内部知识,所以需要在回答时动态取回上下文。

比如用户问:

“PDS-2024-017 项目的验收标准是什么?”

系统可以从项目文档、验收报告、合同附件中找到相关片段,然后让 LLM 汇总回答。

这个模式对文档问答非常有效。

但它也有一个结构性问题:

每一次复杂问题,LLM 都在重新从原始资料里拼答案。

今天用户问“这个项目的验收标准是什么”,系统检索一次。

明天用户问“这个项目为什么延期验收”,系统又检索一次。

后天用户问“这个项目和另一个项目的交付风险有什么不同”,系统还是重新检索、重新拼装。

每一次回答可能都不错,但综合结果通常不会沉淀下来。

也就是说,RAG 很擅长回答“此刻的问题”,但不天然擅长积累“长期的知识结构”。

3. Karpathy 式 LLM Wiki 的工作方式

Karpathy 提出的 LLM Wiki 模式,核心不是“让 AI 写 Wiki 页面”,而是:

让 LLM 持续维护一个持久化、可链接、可演化的 Markdown Wiki。

它通常有三层:

  • raw sources:原始资料,作为事实源,不随意修改。
  • wiki:LLM 维护的 Markdown 页面,包括概念页、实体页、摘要页、比较页、综合页。
  • schema:约束 LLM 如何维护 Wiki 的规则文件,比如AGENTS.mdCLAUDE.md或自定义说明。

当新资料进入时,LLM 不只是把它放进索引里等未来检索,而是会把它编译进已有 Wiki:

  • 新建 source summary
  • 更新概念页
  • 更新实体页
  • 增加 cross-reference
  • 标记新旧资料冲突
  • 更新 index
  • 追加 log
  • 把有价值的 query 结果沉淀成新页面

所以它的关键不是生成,而是维护。

这也是它和普通“AI Wiki”的区别。

普通 AI Wiki 更像是:AI 帮你写页面。

Karpathy 式 LLM Wiki 更像是:AI 像维护代码库一样维护知识库。

4. 核心差异:知识处理时机不同

RAG 和 LLM Wiki 的根本区别,可以放在一张表里看。

维度RAGKarpathy 式 LLM Wiki
核心动作提问时检索资料进入时整理,之后持续维护
知识加工时机query timeingest time / maintenance time
主要对象raw document chunkscurated wiki pages
综合结果多数留在对话里可以写回 Wiki
知识结构依赖检索结果临时形成持续形成概念、实体、链接和索引
适合问题查证、问答、原文引用长期研究、知识沉淀、跨文档综合
主要风险检索不准、上下文不足错误被沉淀、过期内容复用

一句话总结:

RAG 把综合放在问题发生之后。LLM Wiki 把综合前移到资料进入和知识维护阶段。

这就是为什么 LLM Wiki 在一些场景可以替代 RAG。

它替代的不是所有检索能力,而是替代了“每次都从 raw chunks 里临时拼答案”的工作方式。

5. 为什么 LLM Wiki 在一些场景可以替代 RAG

假设你正在研究企业 Agent memory。

你收集了 50 篇文章、几篇论文、一些项目笔记和几段技术讨论。

如果用普通 RAG,当你问:

“Agent memory 有哪些主流路线?”

系统会从这些资料里检索相关 chunk,然后让 LLM 临时总结。

如果你过几天再问:

“RAG、long-term memory、LLM Wiki 的关系是什么?”

系统又要重新检索、重新综合。

但如果用 LLM Wiki,这些资料在进入时就已经被整理成了页面:

  • Agent Memory.md
  • RAG.md
  • Long-term Memory.md
  • LLM Wiki.md
  • Knowledge Runtime.md
  • Open Questions.md
  • Source Index.md

当你再提问时,LLM 可以先读这些整理后的页面。

很多答案不需要再从 50 篇 raw sources 里重新拼,而是基于已经形成的知识结构继续推理。

这就是 LLM Wiki 能部分替代 RAG 的原因:

它把“每次问才综合”变成“持续综合、持续沉淀”。

适合这种替代的场景通常有几个特点:

  • 知识规模中小
  • 主题边界相对清楚
  • 用户愿意参与校准
  • source 质量相对可控
  • 知识需要长期积累
  • 经常出现跨文档综合问题
  • 答案不一定每次都必须直接引用原始 chunk

典型场景包括:

  • 个人知识库
  • 论文研究
  • 读书笔记
  • 课程学习
  • 竞品分析
  • 尽职调查
  • 项目复盘
  • 小团队知识库
  • 专题研究型 Agent

在这些场景里,LLM Wiki 往往比纯 RAG 更有价值。

因为用户需要的不是一次检索结果,而是一套不断变好的知识结构。

6. 为什么它不能完全替代 RAG

但 LLM Wiki 不能无条件替代 RAG。

尤其在企业场景里,很多问题仍然必须依赖 RAG 或搜索系统。

第一,企业知识规模可能很大。

一个企业可能有几十万份文档、工单、合同、会议记录、客户资料和系统日志。全部都靠 LLM 维护成 Wiki,成本和复杂度都很高。

第二,企业知识更新很频繁。

制度、价格、合同、组织架构、项目状态、客户信息都可能变化。如果 Wiki 更新不及时,就会变成一个“看起来很权威但其实过期”的知识层。

第三,权限控制很复杂。

RAG 系统通常可以在检索层做 metadata filter 和 ACL filter,确保用户只能看到有权限的文档。LLM Wiki 如果把多个 source 综合成一个页面,就必须非常小心权限污染:一个用户能不能看到这个综合页面,取决于它引用了哪些 source。

第四,很多问题必须引用原文。

法务、财务、合规、人事制度、合同审查等场景,不能只给综合结论。它必须告诉用户依据来自哪个原始文档、哪一条款、哪个版本。

第五,很多问题高度不可预测。

企业用户会问各种临时问题,比如某个错误码、某个合同编号、某个客户名称、某个表字段、某个接口参数。对于这类精确查询,搜索和 RAG 仍然非常重要。

所以更准确的判断是:

LLM Wiki 可以替代一部分 RAG 的临时综合工作,但不能替代企业级检索、权限、实时性和原文追溯能力。

7. Hybrid Search 为什么仍然重要

企业 RAG 里,一个非常基础但重要的能力是 hybrid search。

它通常指:

  • 关键词检索
  • 向量检索
  • rerank
  • metadata filter

关键词检索擅长精确匹配:

  • 合同编号
  • 客户名称
  • 项目编号
  • 工单号
  • 错误码
  • 接口名
  • 表字段
  • 制度编号

向量检索擅长语义匹配:

  • 同义表达
  • 模糊问题
  • 用户没有使用原文关键词的问题
  • 概念相近的问题

比如用户问:

“员工离职后多久要关账号?”

文档里可能写的是:

“人员离岗后,应在 24 小时内完成系统权限回收。”

这里向量检索有价值。

但如果用户问:

“PDS-2024-017 的验收标准是什么?”

这里项目编号必须精确命中,关键词检索很重要。

所以在企业 Agent 里,hybrid search 仍然是基础能力。

即使引入 LLM Wiki,也不是不要搜索,而是搜索对象可以变得更高级:

  • 不只搜索 raw chunks
  • 也搜索 Wiki pages
  • 必要时再回到 raw sources

这样就形成了更稳的知识运行时。

8. 企业 Agent Knowledge Runtime 的组合方式

如果把 RAG 和 LLM Wiki 放在企业 Agent knowledge runtime 里,我更推荐把它们分层看。

Raw Sources
Docs, PDF, Images, Code, Tickets

Ingestion
Parse, Clean, Permission Sync

LLM Wiki Layer
Concepts, Entities, SOP, FAQ, Synthesis

RAG Index
BM25, Vector, Metadata

Wiki Search
Index, Links, Hybrid Search

Evidence Retrieval
Raw Source Chunks

Agent Runtime

Answer, Cite, Plan, Tool Use

Feedback, Lint, Evaluation

这个架构里,各层职责不同:

  • Raw Sources:事实源。
  • LLM Wiki:知识综合层。
  • RAG Index:证据检索层。
  • Hybrid Search:召回 raw chunks 和 wiki pages。
  • Agent Runtime:理解任务、调用工具、生成回答。
  • Lint / Eval:检查冲突、过期、缺引用、错误回答。

这里最关键的是:

LLM Wiki 不应该替代 raw sources。它应该站在 raw sources 和 Agent runtime 中间。

它负责把知识整理得更好。

RAG 负责在需要证据时回到原文。

Agent 负责把整理后的知识和原始证据用于回答、推理和行动。

9. 不同场景怎么选

可以用几个问题来判断。

问题更偏向
只是做文档问答吗?RAG
是否必须引用原始文档?RAG
是否有大量编号、名称、错误码?Hybrid Search
是否知识长期积累、主题聚焦?LLM Wiki
是否有大量跨文档综合问题?LLM Wiki
是否需要沉淀概念、实体、关系?LLM Wiki
是否文档量巨大、更新频繁?RAG + 自动化索引
是否权限非常复杂?RAG 检索层必须强控制
是否 Agent 要执行任务?LLM Wiki + RAG + Tools

更具体一点:

如果你做的是制度查询、合同条款问答、客服知识库,先做 RAG。

如果你做的是长期研究、项目知识沉淀、专题分析、小团队经验库,优先考虑 LLM Wiki。

如果你做的是企业级 Agent,不要二选一。

应该组合:

  • 用 RAG 保证证据可追溯
  • 用 LLM Wiki 保证知识可积累
  • 用 hybrid search 保证召回质量
  • 用 schema 约束 LLM 如何维护 Wiki
  • 用 lint/eval 保证知识层不腐化
  • 用权限系统保证知识不会越权泄露

10. 一个容易踩的坑:把 LLM Wiki 当成自动摘要库

很多团队看到 LLM Wiki 后,可能会直接做成:

“把所有文档摘要成一堆 Wiki 页面。”

这其实还不够。

如果只是生成页面,而不维护页面之间的关系,不更新旧结论,不记录来源,不检查冲突,不把 query 结果回写,那它只是一个 AI 摘要库。

Karpathy 式 LLM Wiki 的关键在于四个动作:

  • Ingest:新 source 进入时整合进 Wiki
  • Query:基于 Wiki 提问
  • Write-back:有价值的回答写回 Wiki
  • Lint:定期检查冲突、过期、孤岛和缺引用

没有这些动作,就没有复利。

只有内容生成,没有知识维护。

11. 另一个坑:让 Wiki 变成新的幻觉源

LLM Wiki 最大的风险,是错误会沉淀。

RAG 回答错了,可能只是一次回答错。

LLM Wiki 如果把错误写进页面,后续页面又引用它,错误就会变成知识库的一部分。

所以企业场景里必须有治理机制:

  • raw sources 不可随意修改
  • Wiki 页面保留 source 引用
  • 重要结论标记来源和时间
  • 新旧资料冲突要显式记录
  • 高风险内容需要人工审核
  • 定期 lint
  • 定期 eval
  • 支持版本回滚
  • 权限继承必须清楚

LLM Wiki 的正确定位不是“替代事实源”。

它是一个可维护的知识中间层。

事实仍然要回到 raw sources。

12. 我的建议:三种落地路线

如果是个人或小团队,我建议先从轻量 LLM Wiki 开始。

用 Markdown、Obsidian、Git、index.mdlog.md和一个明确的 schema,就可以跑起来。

不一定一开始就上向量数据库。

如果是中型团队知识库,可以采用 LLM Wiki + 本地搜索。

例如:

  • raw sources 保持原样
  • wiki pages 由 LLM 维护
  • index/log 作为导航
  • Markdown 搜索或 BM25 作为检索能力
  • 关键页面人工 review

如果是企业级 Agent,则建议 RAG + LLM Wiki + hybrid search 一起设计。

也就是:

  • RAG 负责证据
  • LLM Wiki 负责综合
  • hybrid search 负责召回
  • tools 负责执行
  • governance 负责安全和质量

这时不要把 LLM Wiki 看成一个文档产品,而要看成 Agent knowledge runtime 的一层。

13. 结论

RAG 和 LLM Wiki 的区别,不是“向量库 vs Markdown”。

真正的区别是:

RAG 在提问时临时检索和综合。

LLM Wiki 在资料进入和维护过程中持续整理和沉淀。

RAG 让 LLM 会查资料。

LLM Wiki 让知识开始复利。

在个人研究、小团队知识库、专题积累场景中,Karpathy 式 LLM Wiki 可以替代一部分 RAG。

在企业级 Agent 场景中,它更适合作为 RAG 的上游知识综合层,而不是完全替代 RAG。

最终比较稳的架构不是二选一,而是:

用 LLM Wiki 沉淀知识,用 RAG 查证事实,用 hybrid search 找到上下文,用 Agent runtime 把知识变成行动。

这才是企业 Agent knowledge runtime 更合理的方向。

参考资料

  • Karpathy 的 LLM Wiki Gist
  • 中文翻译仓库:huajiexiewenfeng/llm-wiki-cn
  • CSDN 翻译文章:Karpathy LLM Wiki 中文翻译
http://www.cnnetsun.cn/news/2558555.html

相关文章:

  • LLM测试工程师必看,Claude E2E测试架构设计,从用例生成、黄金样本构建到回归基线告警闭环
  • FanControl中文版终极指南:Windows专业风扇控制软件完全实战手册
  • 实战指南:用Python构建自动连连看系统的完整解决方案
  • DeepSeek-R1代码生成能力实测:97.3%准确率背后的5个隐藏陷阱与绕过方案
  • 题解:AcWing 4548 猴子和香蕉
  • Unlock-Music:打破平台枷锁的音乐文件解密工具
  • 企业级Veo 2提示词治理框架(含合规校验/版本回溯/效果归因三模块)——仅限首批500名开发者开放》
  • 数据流降采样技术:Downstream库的核心原理与应用
  • 对比直接使用厂商API与通过Taotoken聚合调用的成本体感
  • 微信小程序AR与3D全景开发实战指南:揭秘Three.js在移动端的终极应用
  • Apple-Mobile-Drivers-Installer:Windows上iPhone USB网络共享驱动的终极解决方案
  • LLM Structured Output 生产工程:别再写正则解析JSON 了(工程师踩坑版)
  • FM5057H 二合一锂电池保护 IC
  • 智谱开启狂飙模式!7倍提速,全球最快,旗舰模型即问即答
  • WPF中Style和ControlTemplate的触发器有什么不同
  • 对比直接使用厂商api体验taotoken在路由容灾方面的优势
  • 低成本DIY智能驱猫系统:基于PIR传感器与雨刮水泵的硬件方案
  • 项目文档:基于51单片机的篮球计分器设计
  • 对比直接调用厂商API使用Taotoken聚合调用的延迟体感差异
  • Zotero检索引擎完全指南:如何快速提升文献检索效率
  • Selenium搞不定的文件上传弹窗?试试Playwright的`page.expect_file_chooser()`监听大法
  • 数据要素与大安全:运营商藏在信令里的印钞机
  • CPU-GPU协同加速LLM推理:APEX技术解析与实践
  • Win11鼠标指针太单调?这3个宝藏网站让你免费下载上千款酷炫指针方案
  • 别再傻傻插显示器了!手把手教你用BMC远程给服务器装系统(以浪潮服务器为例)
  • Avidemux视频编辑工具终极指南:5个简单步骤快速上手专业剪辑
  • 量子计算模拟器性能优化:从内存墙到指令级并行
  • Node.js驱动树莓派GPIO:从网页控制LED到舵机实战指南
  • Python之rgb2ansi包语法、参数和实际应用案例
  • 如何在浏览器中解锁加密音乐文件:Unlock-Music完全指南