当前位置: 首页 > news >正文

给 AI加长期记忆:再也不用每次重新交接项目了

你有没有过这样的崩溃时刻?

用 AI 写代码,每次开新对话,都像给新入职的外包做交接:

  • “我们项目用 pnpm,不是 npm”

  • “前端是 React,不是 Vue”

  • “上次我们聊到用户登录模块,卡到了校验这里”

  • “我习惯你先给结论,再讲过程”

说一遍不够,下次开新会话,你还得再说一遍。用了半年的 AI Coding 工具,它对你的了解,永远停留在 “你好,我是新来的”。

这不是 AI 不够聪明,是它没有长期记忆。

有记忆和没记忆的 AI,体验差距是 10 倍,不是 10%。

我给 CodeBuddy 做了一套纯本地的记忆系统

很多人一听到 AI 记忆,就想到要搭向量库、要搞云端服务、要部署一堆复杂的基础设施。

但我搞了一套纯本地方案—— 零外部依赖、不需要向量库、不需要后端服务,纯靠 Markdown 文件和提示词规则,就给 CodeBuddy 加上了长期记忆。

现在它能记住:

  • 你的项目背景

  • 你的协作偏好

  • 你们的历史决策

  • 之前踩过的坑

下次开会话,不用你重新交接,它直接接着上次的活干。

灵感来自 Knot,但把它搬到了本地

这套设计不是我凭空想的,灵感直接来自 Knot 的记忆系统 —— 用过 Knot 的朋友都知道,它的 AI 能跨会话记住你,下次聊天不用重复交代,体验特别好。

我拆解了 Knot 的核心机制,发现它的厉害之处根本不是什么复杂的向量检索,而是信息治理的规则:什么该存、存哪里、谁优先。

所以我把这套设计,原封不动地搬到了 CodeBuddy 里,做成了纯本地的版本。不用云端,所有数据都存在你自己的项目里,安全又放心。

装完之后,你的项目长这样

安装很简单,装完之后,你的项目里会多这么一套文件夹,就像一个整齐的文件柜,把不同的记忆分好类:

项目根目录/ ├── .codebuddy/ │ ├── rules/ │ │ └── memory-system/ RULE.mdc 启动规则(系统驱动器) │ └── memory/ │ ├── INSTRUCTIONS.md 用户硬规则(偏好/约束) │ ├── MEMORY.md 用户画像 + topic 索引(每轮必读) │ └── topic/ 单主题长期记忆 └── .gitignore 自动把memory加到忽略,不会提交到仓库

它是两层分离的:规则是系统,记忆是你自己的。装完的时候记忆是空的,用着用着,它就慢慢 “认识你” 了。

三个核心设计,让记忆真的好用

很多人做记忆系统,就是把聊天记录存起来,结果越存越多,最后上下文都被占满了,AI 反而变笨了。

这套系统不一样,它有三个关键设计,保证记忆好用又不占空间:

1. 权威性分层:不是所有记忆都一样重要

你有没有遇到过 AI 乱听指令?一会儿听你说的,一会儿听它自己记的,搞混了。

这套系统做了严格的优先级分层,就像一个金字塔:

  • 最高优先级: :你主动说的硬规则,比如 “我只用 pnpm”、“回答先给结论”,这些永远是最高的,AI 必须优先听;

  • 中间优先级: :你的用户画像、主题索引,每轮都会读,让 AI 知道你是谁,有哪些主题可以查;

  • 最低优先级:topic/*.md:各个主题的详细记忆,只有需要的时候才会读,不会随便占上下文。

这样一来,AI 永远不会搞混该听谁的,你的硬规则永远不会被背景信息覆盖。

2. 双轨写入:主动记和自动沉淀分开

记忆也分两种:一种是你明确要它记住的,一种是它自己观察到的。

所以这套系统用了双轨写入的机制:

  • 你主动说的 “记住 xxx”:直接写到 里,变成最高优先级的硬规则,比如你说 “记住,我只用 pnpm”,那它永远都会记得;

  • AI 自己沉淀的:比如你们聊了半天,定下了项目的技术决策、踩过的坑,这些它会自动写到 topic 文件夹里,同时更新 MEMORY 里的索引。

这样就不会乱,你明确要求的,它绝对不会忘;它自己观察的,也会好好存着,需要的时候再拿出来。

3. 每轮自检:AI 自己管自己,不用你催

最厉害的是,它有一套每轮自动执行的自检协议,就像一个循环的工作流:

每一轮对话,它都会自动做这几件事:

  1. 开始的时候,先读你的 INSTRUCTIONS 和 MEMORY,知道你的规则和画像;

  2. 然后判断,这次的问题,要不要读某个 topic 的详细记忆?比如你问上次的登录模块,它就自动把那个主题的记忆读出来;

  3. 回答完之后,再自检:这轮有没有产生什么值得存的长期记忆?如果有,就自动写到 topic 里,更新索引。

整个过程,你完全不用管,它自己就把读、判断、写的闭环跑通了。而且它控制了 token 预算,总共也就 5000token 左右,不会挤占你正常对话的空间。

实际体验:从 “新来的外包” 变成 “跟了你三个月的搭档”

这套系统用上之后,最直观的变化是什么?

没有记忆的 AI,是每次都重新入职的外包,你得从头教它 everything; 有记忆的 AI,是已经跟了你三个月的老搭档,你不用说,它都懂。

它带来的不是 “少打几个字”,而是连续性:

  • 任务连续:上次聊到哪、卡在哪、下一步要做什么,它都记得;

  • 判断连续:之前为什么选 A 不选 B,当时的约束和取舍,它都记得;

  • 协作连续:你喜欢先看结论还是先看过程,偏好稳妥还是试错,它都记得。

比如你说 “继续写上次那份方案”,它知道你之前定下的受众、边界、表达风格,不用你再讲一遍; 比如你说 “帮我评估这个新需求”,它会沿用之前的判断框架,不会每次重新发明一套标准; 比如你说 “这个问题上次踩过坑”,它能找到当时的失败原因,避免再走一遍弯路。

开新会话?不存在的,就是接着上次继续干。

云端还是本地?你可以自己选

很多人会问,那我是用 Knot 的云端记忆,还是用这个本地方案?

其实很简单,看你的场景:

  • Knot 云端记忆:开箱即用,支持跨项目,适合团队协作,日常工作用它很方便;

  • 本地 Markdown 方案:纯本地,零依赖,所有数据都在你自己手里,适合个人项目、敏感代码项目,或者你想自己定制规则。

而且这两个不是二选一,你可以并行用:工作上的团队项目用 Knot,自己的私人项目用本地方案,完全没问题。

别提前优化,够用就好

很多人一上来就说,我要搭向量库,我要搞 RAG,我要上最先进的检索。

但其实,大部分人根本用不到。

这套系统有个很清晰的升级路径,你不用一开始就搞全套:

  • V1:topic 少于 10 个的时候,纯提示词 + 文件读写就够了,大部分人停在这就够用了;

  • V2:topic 多了,要跨项目了,再加 MCP Server,支持跨项目共享;

  • V3:topic 超过 30 个了,再加全文检索,方便找东西;

  • V4:topic 超过 100 个了,再加本地向量库,做语义检索。

先跑通闭环,等你真的需要了,再升级。别还没开始用,就先把一堆复杂的基础设施搭起来,大部分时候都是浪费。

怎么装?一分钟搞定

安装超级简单,你不用改代码,不用部署服务,只要给你的 CodeBuddy 说一句话:

/CodeBuddy Markdown Memory帮我安装这一个memory系统

它就会自动帮你把这套系统装好,生成所有的文件,把 memory 加到.gitignore,防止你把个人记忆提交到仓库。

装完之后,新建个会话,测试一下:

继续聊这个项目,先读取我的记忆系统。

如果 AI 回应了记忆相关的内容,那就搞定了。接下来你正常用就行,它会自己慢慢记住你的所有事。


互动时间:你有没有过每次开新对话,都要重新给 AI 交代一遍项目的痛苦经历?比如上次说过的技术栈,下次又要再说一遍?评论区聊聊你的崩溃时刻!

http://www.cnnetsun.cn/news/2441634.html

相关文章:

  • 090、机器人动力学:惯量辨识
  • Verilog数值转换:数字设计工程师必须掌握的底层规则与工程实践
  • TaskbarXI:为Windows 11任务栏注入macOS风格优雅的终极解决方案
  • 咕咚翻译剪贴板监听完全指南:从配置到高级使用 [特殊字符]
  • 30岁程序员的职业分叉口:是继续写代码还是转管理
  • 【多变量输入单步预测】基于金豺算法优化TCN-BiGRU-Attention的风电功率预测研究附Matlab代码
  • 如何免费解锁雀魂全角色皮肤:终极完整配置指南
  • JMSSerializerBundle与FOSRestBundle集成指南:构建高性能API的完整方案
  • 3步搭建免费网盘直链解析服务:彻底告别下载限速烦恼
  • Python正则表达式分组与反向引用:7个实用场景深度解析
  • LangGraph 分布式追踪:为什么你的 Agent 执行链总是“黑盒”?
  • AI思维伙伴:结构化提示工程驱动深度思考与决策
  • pyzk完整指南:5步轻松掌握ZKTeco考勤机Python自动化管理
  • NotebookLM+AlphaFold3协同工作流:打通文献理解→蛋白结构预测→突变效应分析的最后1公里(限时开放调试模板)
  • 【NotebookLM环境科学实战指南】:20年专家亲授3大科研提效秘技,错过再等5年?
  • JVM 调优介绍
  • NotebookLM假设构建辅助深度拆解(从语义锚点到可证伪性设计):谷歌AI Lab内部培训未公开方法论首次披露
  • 5分钟实现Obsidian插件全中文界面:告别英文困扰的智能解决方案
  • IAM Information System,一张看懂 SAP 权限关系网的地图
  • IAM Apps 对 SAP S/4HANA 授权治理的真实影响
  • Windows 10/11打印服务总罢工?别急着重装,试试这几招修复Print Spooler
  • 【我的stm32开发之路-实践篇-嵌入式的hello-world】原创
  • sklearn_tutorial实战案例:如何用高斯混合模型进行密度估计的完整指南 [特殊字符]
  • 猫抓Cat-Catch:浏览器资源嗅探的高效实战指南
  • 3步彻底解决显卡驱动残留问题:Display Driver Uninstaller完整指南
  • 开源光标主题集合:提升开发者工作效率与视觉舒适度
  • 在长期项目中体会Taotoken多模型聚合带来的灵活性
  • 深入解析接收机动态范围:从核心指标到系统级设计优化
  • HiveWE终极指南:如何快速制作魔兽争霸III地图
  • JQTools部署与编译指南:跨平台构建Qt工具包的完整流程