当前位置：首页 > news >正文

RAG 是临时查资料，LLM Wiki 是让知识开始复利

news 2026/6/4 19:08:57

RAG 是临时查资料，LLM Wiki 是让知识开始复利

1. 问题不是“选 RAG 还是选 Wiki”

在企业 Agent 落地时，一个很容易出现的问题是：

到底应该做 RAG，还是做 LLM Wiki？

如果你还没有读过 Karpathy 的 LLM Wiki 原文，可以先看我整理的中文翻译仓库：

中文翻译仓库：huajiexiewenfeng/llm-wiki-cn

本文不重复翻译原文，而是基于 Karpathy 的 LLM Wiki 思路，继续讨论它和 RAG 在企业 Agent knowledge runtime 中的选型关系。

这个问题表面上是在选技术方案，实际上是在问另一个更底层的问题：

企业知识到底应该在什么时候被加工？

RAG 的答案是：用户提问时再加工。

Karpathy 式 LLM Wiki 的答案是：资料进入知识库时就开始加工，并且持续维护。

这两个方向不是简单替代关系。它们真正的差别，不在于有没有向量数据库，也不在于是不是 Markdown，而在于知识处理发生的阶段不同。

RAG 是 query-time retrieval。
LLM Wiki 是 ingest-time / maintenance-time synthesis。

RAG 更像临时查资料。

LLM Wiki 更像让知识开始复利。

2. 普通 RAG 的工作方式

普通 RAG 的典型流程是：

收集企业文档
文档解析和切分
建立关键词索引或向量索引
用户提问
系统检索相关 chunk
LLM 基于检索结果生成答案

它解决了一个非常实际的问题：LLM 本身不知道企业内部知识，所以需要在回答时动态取回上下文。

比如用户问：

“PDS-2024-017 项目的验收标准是什么？”

系统可以从项目文档、验收报告、合同附件中找到相关片段，然后让 LLM 汇总回答。

这个模式对文档问答非常有效。

但它也有一个结构性问题：

每一次复杂问题，LLM 都在重新从原始资料里拼答案。

今天用户问“这个项目的验收标准是什么”，系统检索一次。

明天用户问“这个项目为什么延期验收”，系统又检索一次。

后天用户问“这个项目和另一个项目的交付风险有什么不同”，系统还是重新检索、重新拼装。

每一次回答可能都不错，但综合结果通常不会沉淀下来。

也就是说，RAG 很擅长回答“此刻的问题”，但不天然擅长积累“长期的知识结构”。

3. Karpathy 式 LLM Wiki 的工作方式

Karpathy 提出的 LLM Wiki 模式，核心不是“让 AI 写 Wiki 页面”，而是：

让 LLM 持续维护一个持久化、可链接、可演化的 Markdown Wiki。

它通常有三层：

raw sources：原始资料，作为事实源，不随意修改。
wiki：LLM 维护的 Markdown 页面，包括概念页、实体页、摘要页、比较页、综合页。
schema：约束 LLM 如何维护 Wiki 的规则文件，比如AGENTS.md、CLAUDE.md或自定义说明。

当新资料进入时，LLM 不只是把它放进索引里等未来检索，而是会把它编译进已有 Wiki：

新建 source summary
更新概念页
更新实体页
增加 cross-reference
标记新旧资料冲突
更新 index
追加 log
把有价值的 query 结果沉淀成新页面

所以它的关键不是生成，而是维护。

这也是它和普通“AI Wiki”的区别。

普通 AI Wiki 更像是：AI 帮你写页面。

Karpathy 式 LLM Wiki 更像是：AI 像维护代码库一样维护知识库。

4. 核心差异：知识处理时机不同

RAG 和 LLM Wiki 的根本区别，可以放在一张表里看。

维度	RAG	Karpathy 式 LLM Wiki
核心动作	提问时检索	资料进入时整理，之后持续维护
知识加工时机	query time	ingest time / maintenance time
主要对象	raw document chunks	curated wiki pages
综合结果	多数留在对话里	可以写回 Wiki
知识结构	依赖检索结果临时形成	持续形成概念、实体、链接和索引
适合问题	查证、问答、原文引用	长期研究、知识沉淀、跨文档综合
主要风险	检索不准、上下文不足	错误被沉淀、过期内容复用

一句话总结：

RAG 把综合放在问题发生之后。LLM Wiki 把综合前移到资料进入和知识维护阶段。

这就是为什么 LLM Wiki 在一些场景可以替代 RAG。

它替代的不是所有检索能力，而是替代了“每次都从 raw chunks 里临时拼答案”的工作方式。

5. 为什么 LLM Wiki 在一些场景可以替代 RAG

假设你正在研究企业 Agent memory。

你收集了 50 篇文章、几篇论文、一些项目笔记和几段技术讨论。

如果用普通 RAG，当你问：

“Agent memory 有哪些主流路线？”

系统会从这些资料里检索相关 chunk，然后让 LLM 临时总结。

如果你过几天再问：

“RAG、long-term memory、LLM Wiki 的关系是什么？”

系统又要重新检索、重新综合。

但如果用 LLM Wiki，这些资料在进入时就已经被整理成了页面：

Agent Memory.md
RAG.md
Long-term Memory.md
LLM Wiki.md
Knowledge Runtime.md
Open Questions.md
Source Index.md

当你再提问时，LLM 可以先读这些整理后的页面。

很多答案不需要再从 50 篇 raw sources 里重新拼，而是基于已经形成的知识结构继续推理。

这就是 LLM Wiki 能部分替代 RAG 的原因：

它把“每次问才综合”变成“持续综合、持续沉淀”。

适合这种替代的场景通常有几个特点：

知识规模中小
主题边界相对清楚
用户愿意参与校准
source 质量相对可控
知识需要长期积累
经常出现跨文档综合问题
答案不一定每次都必须直接引用原始 chunk

典型场景包括：

个人知识库
论文研究
读书笔记
课程学习
竞品分析
尽职调查
项目复盘
小团队知识库
专题研究型 Agent

在这些场景里，LLM Wiki 往往比纯 RAG 更有价值。

因为用户需要的不是一次检索结果，而是一套不断变好的知识结构。

6. 为什么它不能完全替代 RAG

但 LLM Wiki 不能无条件替代 RAG。

尤其在企业场景里，很多问题仍然必须依赖 RAG 或搜索系统。

第一，企业知识规模可能很大。

一个企业可能有几十万份文档、工单、合同、会议记录、客户资料和系统日志。全部都靠 LLM 维护成 Wiki，成本和复杂度都很高。

第二，企业知识更新很频繁。

制度、价格、合同、组织架构、项目状态、客户信息都可能变化。如果 Wiki 更新不及时，就会变成一个“看起来很权威但其实过期”的知识层。

第三，权限控制很复杂。

RAG 系统通常可以在检索层做 metadata filter 和 ACL filter，确保用户只能看到有权限的文档。LLM Wiki 如果把多个 source 综合成一个页面，就必须非常小心权限污染：一个用户能不能看到这个综合页面，取决于它引用了哪些 source。

第四，很多问题必须引用原文。

法务、财务、合规、人事制度、合同审查等场景，不能只给综合结论。它必须告诉用户依据来自哪个原始文档、哪一条款、哪个版本。

第五，很多问题高度不可预测。

企业用户会问各种临时问题，比如某个错误码、某个合同编号、某个客户名称、某个表字段、某个接口参数。对于这类精确查询，搜索和 RAG 仍然非常重要。

所以更准确的判断是：

LLM Wiki 可以替代一部分 RAG 的临时综合工作，但不能替代企业级检索、权限、实时性和原文追溯能力。

7. Hybrid Search 为什么仍然重要

企业 RAG 里，一个非常基础但重要的能力是 hybrid search。

它通常指：

关键词检索
向量检索
rerank
metadata filter

关键词检索擅长精确匹配：

合同编号
客户名称
项目编号
工单号
错误码
接口名
表字段
制度编号

向量检索擅长语义匹配：

同义表达
模糊问题
用户没有使用原文关键词的问题
概念相近的问题

比如用户问：

“员工离职后多久要关账号？”

文档里可能写的是：

“人员离岗后，应在 24 小时内完成系统权限回收。”

这里向量检索有价值。

但如果用户问：

“PDS-2024-017 的验收标准是什么？”

这里项目编号必须精确命中，关键词检索很重要。

所以在企业 Agent 里，hybrid search 仍然是基础能力。

即使引入 LLM Wiki，也不是不要搜索，而是搜索对象可以变得更高级：

不只搜索 raw chunks
也搜索 Wiki pages
必要时再回到 raw sources

这样就形成了更稳的知识运行时。

8. 企业 Agent Knowledge Runtime 的组合方式

如果把 RAG 和 LLM Wiki 放在企业 Agent knowledge runtime 里，我更推荐把它们分层看。

这个架构里，各层职责不同：

Raw Sources：事实源。
LLM Wiki：知识综合层。
RAG Index：证据检索层。
Hybrid Search：召回 raw chunks 和 wiki pages。
Agent Runtime：理解任务、调用工具、生成回答。
Lint / Eval：检查冲突、过期、缺引用、错误回答。

这里最关键的是：

LLM Wiki 不应该替代 raw sources。它应该站在 raw sources 和 Agent runtime 中间。

它负责把知识整理得更好。

RAG 负责在需要证据时回到原文。

Agent 负责把整理后的知识和原始证据用于回答、推理和行动。

9. 不同场景怎么选

可以用几个问题来判断。

问题	更偏向
只是做文档问答吗？	RAG
是否必须引用原始文档？	RAG
是否有大量编号、名称、错误码？	Hybrid Search
是否知识长期积累、主题聚焦？	LLM Wiki
是否有大量跨文档综合问题？	LLM Wiki
是否需要沉淀概念、实体、关系？	LLM Wiki
是否文档量巨大、更新频繁？	RAG + 自动化索引
是否权限非常复杂？	RAG 检索层必须强控制
是否 Agent 要执行任务？	LLM Wiki + RAG + Tools