当前位置: 首页 > news >正文

LLM、Token、RAG、MCP……这10个AI名词,一张图给你讲明白

AI入门科普 · 第1篇

LLM、Token、RAG、MCP……这10个AI名词,一张图给你讲明白

程序猿Joe · 2026-06-29

大家好,我是程序猿Joe

前两天有个读者私信我:“Joe哥,我看AI文章的时候,满屏都是 LLM、Token、Prompt、RAG、MCP、Agent……这些词到底啥意思?每个都懂一点,但串起来就懵了。”

说实话,我刚接触AI那会儿也是这样。看一篇技术博客,查3次百度百科,结果越查越乱。直到我把这些名词串成一条"AI进化链",才发现它们根本不是孤立的,而是一层层叠加起来的。

今天就用最接地气的方式,把这10个最常见的AI名词一次性讲清楚。看完这篇,你再看任何AI文章都不会卡壳了。建议先收藏。


一、一切的开始:LLM,AI的"大脑"

**LLM(Large Language Model,大语言模型)**就是AI的"大脑"。

你可以把它想象成一个读了海量书籍的超级学霸。它通过学习万亿级别的文字,掌握了语言的规律。你输入一句话,它其实是在"预测"下一句最可能是什么——只不过它预测得特别准,准到看起来像"理解"了你说的话。

我们熟知的 ChatGPT、Claude、DeepSeek,背后都是 LLM。

一句话:LLM 是地基。后面所有的AI能力,都建立在这个"大脑"之上。

二、大脑怎么"读"文字?Token

LLM 不是直接读"字"或"单词"的。它读的是Token

Token 是AI处理文字时的最小单位。中文里,1个字通常是1个Token;英文里,1个单词可能被拆成2-3个Token(比如 “unbelievable” 会被拆成 “un” + “believ” + “able”)。

为啥要拆?因为AI的"脑容量"是有限的,用Token来计量最省空间。就像快递打包,把衣服叠成方块比一团塞进去更省地方。

记住一个原则:Token 越少,AI处理越快、越便宜。所以写 Prompt 时,精简文字就是在省钱。

三、怎么跟大脑对话?Prompt

**Prompt(提示词)**就是你对AI说的"指令"。

但同样一个大脑,你问"写个代码"和问"你是一个10年经验的Python工程师,请用Flask写一个带JWT认证的RESTful API,要求包含单元测试",得到的答案天差地别。

**Prompt Engineering(提示词工程)**就是研究"怎么把话说清楚"的学问。它不是什么高深技术,核心就一句话:给AI越明确的上下文和约束,它输出越精准。

举个生活中的例子

你让同事"帮买个外卖",他可能买错。但你说明"帮我点一份少油少盐的黄焖鸡,加一份米饭,送到3楼会议室,12点前到",成功率就高得多。Prompt Engineering 就是让你的指令从模糊变精确的过程。

四、大脑能"记住"多少?Context 和 Memory

LLM 有个很大的限制:它没有真正的长期记忆

**Context(上下文)**是AI在当前对话里能"看到"的内容。比如你跟ChatGPT聊了半天,它之所以能接上你的话,是因为你把之前的聊天记录都发给了它——这些内容就是 Context。但这个窗口是有限的,超过上限,早期的内容就会被"遗忘"。

**Memory(记忆)**则是想办法让AI"记住"你。比如ChatGPT的"记忆功能",会把你的偏好存起来,下次对话时自动带入。

划重点:Context 是"短期记忆",有容量上限;Memory 是"长期记忆",需要额外的存储机制来实现。

五、大脑能产出什么?AIGC

**AIGC(AI Generated Content,生成式AI内容)**就是AI"生产"出来的所有东西。

文字(文章、代码、邮件)、图片(Midjourney、Stable Diffusion)、视频(Sora)、音乐(Suno)——这些都是AIGC。本质上是LLM这个"大脑"把学到的知识"重新组合"后输出的结果。

你可以把AIGC理解为大脑的**“表达能力”**。会聊天、会画图、会写歌,都是同一个大脑在不同领域的"才艺展示"。

六、大脑怎么查资料?RAG

LLM 有个致命问题:它会"一本正经地胡说八道",专业术语叫"幻觉"(Hallucination)。

为什么?因为它的知识来自训练数据,有截止日期,而且可能记错。**RAG(Retrieval-Augmented Generation,检索增强生成)**就是解决这个问题的。

核心思路特简单:先查资料,再回答。

比如你问AI"我们公司今年的销售数据怎么样",RAG会先到你的内部文档/数据库里检索相关内容,把找到的资料"喂"给AI,然后让AI基于这些资料来回答。这样AI就不会瞎编了。

方式原理缺点
纯LLM靠训练数据里的记忆回答知识过时、容易幻觉
RAG先检索外部资料,再基于资料生成检索质量决定回答质量

七、大脑怎么"用手"?MCP

到目前为止,我们的AI还只能"动嘴"——回答问题、生成内容。但如果想让它真正干活呢?比如查数据库、发邮件、操作文件?

MCP(Model Context Protocol,模型上下文协议)就是解决这个问题的。它是Anthropic提出的一套开放标准,相当于AI和外部工具之间的"USB-C接口"。

以前,你想让AI操作你的数据库,得写一堆集成代码。现在有了MCP,只要数据库提供了MCP Server,任何支持MCP的AI(Cursor、VS Code Copilot、ChatGPT等)都能直接调用——一次配置,到处使用。

一句话:MCP 让 AI 从"会说话"变成了"能动手"。

八、大脑的"专业技能":Skill

**Skill(技能)**可以理解为AI被额外训练出来的一种专门能力。

打个比方:LLM本身是个"通才",但如果你想让它专门帮你做代码审查、写测试用例、或者分析财务报表,你可以给它训练一个 Skill。这个Skill里包含了特定的知识、工具和流程。

在MCP生态里,Skill通常指的是一组预定义好的工具组合+提示词模板。比如"前端开发助手"这个Skill,可能包含了读写文件、查询文档、运行测试等一系列工具,以及对应的Prompt模板。

九、从"被动回答"到"主动做事":Agent

普通AI聊天是**“你问一句,它答一句”**——被动模式。

Agent(智能体)则是"你给一个目标,它自己想办法完成"——主动模式。

比如你跟Agent说:"帮我调研一下竞品最近三个月的功能更新,整理成一份报告发到我的邮箱。"Agent会自己分解任务:

  • ① 搜索竞品官网和更新日志
  • ② 整理关键功能点
  • ③ 生成报告文档
  • ④ 调用邮件工具发送

整个过程不需要你一步步指挥,Agent自己规划、执行、调整。Agent = LLM大脑 + MCP手脚 + Skill专业技能 + 自主规划能力。

十、管理一群AI干活:Harness Engineering

当AI能主动做事之后,新的问题出现了:怎么让一堆AI、工具、工作流稳定地协同工作,不出乱子?

**Harness Engineering(驾驭工程)**就是解决这个问题的。它是一套工程方法论,核心思想是:给AI系统加上"缰绳"和"马鞍"——既要让它跑得快,又要保证不跑偏。

具体来说,包括监控AI的执行过程、设置安全边界、处理异常情况、评估输出质量等。就像你不会让一个刚学会开车的实习生独自上高速,Harness Engineering 就是给AI系统上的"保险"和"导航系统"。


一张图串起来:AI的进化链

看完这10个名词,你可能会觉得信息量很大。但如果把它们串成一条链,逻辑就清晰了:

  • LLM= 大脑(基础能力)
  • Token= 大脑处理信息的方式
  • Prompt= 跟大脑说话的语言
  • Context/Memory= 大脑的记忆力
  • AIGC= 大脑的产出物
  • RAG= 大脑查资料的能力
  • MCP= 大脑操作外部工具的手
  • Skill= 大脑的专业技能包
  • Agent= 有大脑、有手、有技能,能自主干活的"人"
  • Harness Engineering= 管理这群"人"干活的工程方法
层级对应名词类比
基础层LLM、Token大脑 + 思维方式
交互层Prompt、Context、Memory说话方式 + 记忆力
产出层AIGC、RAG创作能力 + 查资料能力
扩展层MCP、Skill手 + 专业技能
应用层Agent、Harness Engineering完整的人 + 管理团队

常见误区(我踩过的坑)

误区1:这些名词是互斥的,学了A就不用学B

恰恰相反,它们是层层叠加的关系。你理解LLM,才能更好地写Prompt;会写Prompt,才能用好RAG;有了RAG和MCP,才能搭出Agent。别想着跳过基础直接上Agent,地基不牢会摔得很惨。

误区2:AIGC就是聊天机器人

AIGC的范围远不止文字聊天。图片、视频、音频、代码、3D模型……只要AI"生成"出来的东西,都叫AIGC。聊天只是其中一种形式。

误区3:有了Agent,程序员就要失业了

Agent确实能干很多活,但它需要Harness Engineering来约束和管理。谁来设计Harness?谁来定义Skill?谁来评估Agent的输出质量?还是程序员。工具变了,但工程思维永远不过时。


总结

回看这些AI技术名词,你会发现它们其实都在解决同一件事:怎么让AI从"回答一句话",慢慢变成真正能协助人完成工作的系统。

最开始,AI只是"能聊天"(LLM + Prompt)。后来,它开始理解复杂指令、记住上下文、生成文字图片视频(Context + Memory + AIGC)。再后来,它会查资料、调用工具、执行复杂任务(RAG + MCP + Skill + Agent)。最后,我们用工程化的方法把它们管理起来(Harness Engineering)。

技术名词不可怕,可怕的是把它们当成孤立的孤岛。串成链、理清楚,你会发现AI的世界没那么复杂。


如果觉得这篇文章对你有帮助,欢迎点赞、在看、转发三连!有问题也可以在评论区留言,我会尽量回复。

关于作者:程序猿Joe,从CRUD程序员到架构师的蜕变者,专治各种"代码癌症"。不定期分享技术干货,欢迎关注。

http://www.cnnetsun.cn/news/3055308.html

相关文章:

  • TPIC7710评估板实战指南:从硬件连接到电机控制与故障诊断
  • 从零到一:用nssm将任意应用封装为Windows服务
  • 实战!LangGraph Multi-Agent Supervisor 模式:手把手构建生产级多智能体系统
  • 用Rust给Python写一个高性能扩展模块(PyO3实战)
  • XCP协议:从总线标定到汽车ECU数据交互的核心
  • HarmonyOS APP《画伴梦工厂》开发第9篇:相机开发实战——调用系统相机拍照
  • 税务申报工具:税法规则与自动计算的系统
  • HarmonyOS APP《画伴梦工厂》开发第10篇:相册选择与 PhotoViewPicker——从相册导入图片
  • Java的java.lang.foreign.MemorySegment内存访问模式与缓存友好性优化
  • AI之长效智能体Hermes Agent
  • 实时更新策略
  • BufferedInputStream 源码——带有缓冲区的装饰器类 BufferedInputStream.class 的UML关系图,如下所示:
  • 现存coding plan /token plan推荐
  • LockSupport简介
  • 基于超混沌系统和SHA-256算法的图像加密算法研究算法matlab实现
  • 数学建模一键生成所有图片的实验代码
  • 【滤波】基于平方根无迹卡尔曼滤波SR-UKF实现信号去噪附matlab代码
  • 无特征0day穿透边界防护未触发任何告警 全量行为建模如何4小时锁死全链路影响范围
  • 氢燃料电池(PEMFC)系统仿真建模+空压机、阴极、阳极、电堆模型Matlab仿真
  • AI 前沿速报 | 2026年第27周(6月22日 — 6月28日)
  • 实战指南 | 基于STM32F407 - 利用STM32CubeProgrammer的USB DFU实现无硬件Boot引脚固件升级
  • 高通正面挑战英伟达、华为腾讯百度抢机器人大脑、A股反弹
  • Adobe Illustrator脚本革命:Fillinger智能填充工具的终极指南
  • 意式轻奢高定木作盘点:图森、M77 之外的高性价比之选
  • 【数据融合】千亿体素多维荧光成像结合单像素检测和数据融合附Matlab代码
  • 量子约束优化搜索框架CBQS解析与应用
  • 二分图匈牙利算法KM算法
  • libTomCrypt 轻量级加密库完整教程|编译安装、应用场景、C++ 封装加解密实战代码
  • 大麦抢票协议算法
  • 量化回测【2026.06.29】