当前位置：首页 > news >正文

LLM、Token、RAG、MCP……这10个AI名词，一张图给你讲明白

news 2026/6/30 2:16:01

AI入门科普 · 第1篇

LLM、Token、RAG、MCP……这10个AI名词，一张图给你讲明白

程序猿Joe · 2026-06-29

大家好，我是程序猿Joe。

前两天有个读者私信我：“Joe哥，我看AI文章的时候，满屏都是 LLM、Token、Prompt、RAG、MCP、Agent……这些词到底啥意思？每个都懂一点，但串起来就懵了。”

说实话，我刚接触AI那会儿也是这样。看一篇技术博客，查3次百度百科，结果越查越乱。直到我把这些名词串成一条"AI进化链"，才发现它们根本不是孤立的，而是一层层叠加起来的。

今天就用最接地气的方式，把这10个最常见的AI名词一次性讲清楚。看完这篇，你再看任何AI文章都不会卡壳了。建议先收藏。

一、一切的开始：LLM，AI的"大脑"

**LLM（Large Language Model，大语言模型）**就是AI的"大脑"。

你可以把它想象成一个读了海量书籍的超级学霸。它通过学习万亿级别的文字，掌握了语言的规律。你输入一句话，它其实是在"预测"下一句最可能是什么——只不过它预测得特别准，准到看起来像"理解"了你说的话。

我们熟知的 ChatGPT、Claude、DeepSeek，背后都是 LLM。

一句话：LLM 是地基。后面所有的AI能力，都建立在这个"大脑"之上。

二、大脑怎么"读"文字？Token

LLM 不是直接读"字"或"单词"的。它读的是Token。

Token 是AI处理文字时的最小单位。中文里，1个字通常是1个Token；英文里，1个单词可能被拆成2-3个Token（比如 “unbelievable” 会被拆成 “un” + “believ” + “able”）。

为啥要拆？因为AI的"脑容量"是有限的，用Token来计量最省空间。就像快递打包，把衣服叠成方块比一团塞进去更省地方。

记住一个原则：Token 越少，AI处理越快、越便宜。所以写 Prompt 时，精简文字就是在省钱。

三、怎么跟大脑对话？Prompt

**Prompt（提示词）**就是你对AI说的"指令"。

但同样一个大脑，你问"写个代码"和问"你是一个10年经验的Python工程师，请用Flask写一个带JWT认证的RESTful API，要求包含单元测试"，得到的答案天差地别。

**Prompt Engineering（提示词工程）**就是研究"怎么把话说清楚"的学问。它不是什么高深技术，核心就一句话：给AI越明确的上下文和约束，它输出越精准。

举个生活中的例子

你让同事"帮买个外卖"，他可能买错。但你说明"帮我点一份少油少盐的黄焖鸡，加一份米饭，送到3楼会议室，12点前到"，成功率就高得多。Prompt Engineering 就是让你的指令从模糊变精确的过程。

四、大脑能"记住"多少？Context 和 Memory

LLM 有个很大的限制：它没有真正的长期记忆。

**Context（上下文）**是AI在当前对话里能"看到"的内容。比如你跟ChatGPT聊了半天，它之所以能接上你的话，是因为你把之前的聊天记录都发给了它——这些内容就是 Context。但这个窗口是有限的，超过上限，早期的内容就会被"遗忘"。

**Memory（记忆）**则是想办法让AI"记住"你。比如ChatGPT的"记忆功能"，会把你的偏好存起来，下次对话时自动带入。

划重点：Context 是"短期记忆"，有容量上限；Memory 是"长期记忆"，需要额外的存储机制来实现。

五、大脑能产出什么？AIGC

**AIGC（AI Generated Content，生成式AI内容）**就是AI"生产"出来的所有东西。

文字（文章、代码、邮件）、图片（Midjourney、Stable Diffusion）、视频（Sora）、音乐（Suno）——这些都是AIGC。本质上是LLM这个"大脑"把学到的知识"重新组合"后输出的结果。

你可以把AIGC理解为大脑的**“表达能力”**。会聊天、会画图、会写歌，都是同一个大脑在不同领域的"才艺展示"。

六、大脑怎么查资料？RAG

LLM 有个致命问题：它会"一本正经地胡说八道"，专业术语叫"幻觉"（Hallucination）。

为什么？因为它的知识来自训练数据，有截止日期，而且可能记错。**RAG（Retrieval-Augmented Generation，检索增强生成）**就是解决这个问题的。

核心思路特简单：先查资料，再回答。

比如你问AI"我们公司今年的销售数据怎么样"，RAG会先到你的内部文档/数据库里检索相关内容，把找到的资料"喂"给AI，然后让AI基于这些资料来回答。这样AI就不会瞎编了。

方式	原理	缺点
纯LLM	靠训练数据里的记忆回答	知识过时、容易幻觉
RAG	先检索外部资料，再基于资料生成	检索质量决定回答质量

七、大脑怎么"用手"？MCP

到目前为止，我们的AI还只能"动嘴"——回答问题、生成内容。但如果想让它真正干活呢？比如查数据库、发邮件、操作文件？

MCP（Model Context Protocol，模型上下文协议）就是解决这个问题的。它是Anthropic提出的一套开放标准，相当于AI和外部工具之间的"USB-C接口"。

以前，你想让AI操作你的数据库，得写一堆集成代码。现在有了MCP，只要数据库提供了MCP Server，任何支持MCP的AI（Cursor、VS Code Copilot、ChatGPT等）都能直接调用——一次配置，到处使用。

一句话：MCP 让 AI 从"会说话"变成了"能动手"。

八、大脑的"专业技能"：Skill

**Skill（技能）**可以理解为AI被额外训练出来的一种专门能力。

打个比方：LLM本身是个"通才"，但如果你想让它专门帮你做代码审查、写测试用例、或者分析财务报表，你可以给它训练一个 Skill。这个Skill里包含了特定的知识、工具和流程。

在MCP生态里，Skill通常指的是一组预定义好的工具组合+提示词模板。比如"前端开发助手"这个Skill，可能包含了读写文件、查询文档、运行测试等一系列工具，以及对应的Prompt模板。

九、从"被动回答"到"主动做事"：Agent

普通AI聊天是**“你问一句，它答一句”**——被动模式。

Agent（智能体）则是"你给一个目标，它自己想办法完成"——主动模式。

比如你跟Agent说："帮我调研一下竞品最近三个月的功能更新，整理成一份报告发到我的邮箱。"Agent会自己分解任务：

① 搜索竞品官网和更新日志
② 整理关键功能点
③ 生成报告文档
④ 调用邮件工具发送

整个过程不需要你一步步指挥，Agent自己规划、执行、调整。Agent = LLM大脑 + MCP手脚 + Skill专业技能 + 自主规划能力。

十、管理一群AI干活：Harness Engineering

当AI能主动做事之后，新的问题出现了：怎么让一堆AI、工具、工作流稳定地协同工作，不出乱子？

**Harness Engineering（驾驭工程）**就是解决这个问题的。它是一套工程方法论，核心思想是：给AI系统加上"缰绳"和"马鞍"——既要让它跑得快，又要保证不跑偏。

具体来说，包括监控AI的执行过程、设置安全边界、处理异常情况、评估输出质量等。就像你不会让一个刚学会开车的实习生独自上高速，Harness Engineering 就是给AI系统上的"保险"和"导航系统"。

一张图串起来：AI的进化链

看完这10个名词，你可能会觉得信息量很大。但如果把它们串成一条链，逻辑就清晰了：

LLM= 大脑（基础能力）
Token= 大脑处理信息的方式
Prompt= 跟大脑说话的语言
Context/Memory= 大脑的记忆力
AIGC= 大脑的产出物
RAG= 大脑查资料的能力
MCP= 大脑操作外部工具的手
Skill= 大脑的专业技能包
Agent= 有大脑、有手、有技能，能自主干活的"人"
Harness Engineering= 管理这群"人"干活的工程方法

层级	对应名词	类比
基础层	LLM、Token	大脑 + 思维方式
交互层	Prompt、Context、Memory	说话方式 + 记忆力
产出层	AIGC、RAG	创作能力 + 查资料能力
扩展层	MCP、Skill	手 + 专业技能
应用层	Agent、Harness Engineering	完整的人 + 管理团队

常见误区（我踩过的坑）

误区1：这些名词是互斥的，学了A就不用学B

恰恰相反，它们是层层叠加的关系。你理解LLM，才能更好地写Prompt；会写Prompt，才能用好RAG；有了RAG和MCP，才能搭出Agent。别想着跳过基础直接上Agent，地基不牢会摔得很惨。

误区2：AIGC就是聊天机器人

AIGC的范围远不止文字聊天。图片、视频、音频、代码、3D模型……只要AI"生成"出来的东西，都叫AIGC。聊天只是其中一种形式。

误区3：有了Agent，程序员就要失业了

Agent确实能干很多活，但它需要Harness Engineering来约束和管理。谁来设计Harness？谁来定义Skill？谁来评估Agent的输出质量？还是程序员。工具变了，但工程思维永远不过时。

总结

回看这些AI技术名词，你会发现它们其实都在解决同一件事：怎么让AI从"回答一句话"，慢慢变成真正能协助人完成工作的系统。

最开始，AI只是"能聊天"（LLM + Prompt）。后来，它开始理解复杂指令、记住上下文、生成文字图片视频（Context + Memory + AIGC）。再后来，它会查资料、调用工具、执行复杂任务（RAG + MCP + Skill + Agent）。最后，我们用工程化的方法把它们管理起来（Harness Engineering）。