当前位置：首页 > news >正文

让 AI Agent 更可靠：Harness Engineering 与多 Agent 系统工程实践

news 2026/5/31 20:19:18

我们遇到了什么问题

如果你做过 AI 辅助分析工具，大概率踩过这两个坑：

坑一：AI 结论忽好忽坏。任务流程一长，AI 就开始"飘"——用词精准、语气自信，但结论经不起推敲。更坑的是，你问它"你确定吗"，它会更加笃定地告诉你"是的，完全正确"。

坑二：Token 越烧越多。上下文越堆越厚，每次启动都要把历史上下文全部重新喂给模型，Token 消耗线性增长，但分析质量不升反降。

这正是我们团队在开发 CarPlay bug 分析工具时遇到的真实困境。AI 在多项目、长链路的 bug 分析中，分析报告质量严重不稳定；引入多 Agent 架构后，Token 消耗和运行时间又大幅增加。

这两个问题，促使我们去找一套系统性的解决方案。

一、Harness Engineering：给 AI 套上"缰绳"

问题：不确定性是 Agent 的原罪

大模型天生有随机性。在单轮对话里，这点随机性是创意的来源；但在长链路任务里，它是灾难的根源。

一个典型的失控场景：你让 Agent 完成一个分 10 步的开发任务。前 7 步一切正常，第 8 步 Agent 稍微偏了一下，第 9 步继续往偏了的方向走，第 10 步你收到了一个看起来完整、实则驴唇不对马嘴的结果。你还没意识到问题，因为 Agent 写了一段很有说服力的总结。

当 AI 开始连续执行时，如何监督并及时纠正，成了核心工程问题。

方案：Agent = Model + Harness

2026 年 2 月，Martin Fowler 团队（作者 Birgitta Böckeler）提出了Harness Engineering这个概念：

Agent = Model（模型）+ Harness（约束框架）

Harness是 Agent 里除了模型之外的一切东西——提示词、工具定义、规则约束、上下文管理、校验机制、反馈循环，全部统称为 Harness。

这个定义乍看平淡，但背后有个重要的思维转变：要提升 Agent 的稳定性，不是换更好的模型，而是设计更好的 Harness。

Harness 由两部分组成：

Guides（前馈）：在 AI 行动前给它正确的输入——清晰的指令、相关的上下文、结构化的任务描述
Sensors（反馈）：在 AI 行动后检验输出——独立的验证器、质量评估、异常检测

LangChain 团队的实验很直观：在不换底层模型的情况下，仅靠 Harness Engineering，他们的 Agent 排名从 30 名以外提升到了前五名。

解决：在问题到达人眼之前自动修正

一句话概括 Harness Engineering 的目标：

要让 AI Agent 在更少人工监督下工作，需要系统化地构建一套"外部控制框架"——Harness。它由前馈的 Guides 和反馈的 Sensors 组成，目标是在问题到达人眼之前就自动修正。

二、单 Agent 的两个致命失败模式

有了框架方向，我们来看单 Agent 具体会在哪里失控。Anthropic 在《Harness design for long-running application development》中识别了两类核心失败模式：

失败模式一：上下文焦虑（Context Anxiety）

任务太长，Agent 接近上下文窗口上限时会"焦虑"，开始草草收尾——把没完成的工作标记为完成，把模糊的分析写成确定的结论。

这不是模型的 bug，是它在用"自信的收尾"来应对"不确定的延续"。

解决方案：不是 Compact（压缩上下文），而是Context Reset——完全清空上下文，带结构化的交接文件启动新 Agent，让新 Agent 接棒继续工作。

失败模式二：自我评估失灵

让 Agent 评估自己的输出，它会"病态乐观"——即使结果很糟糕，它也会自我点赞，因为它的评估基于生成该结果时的同一套认知框架。

就像让一个人同时做卷子又改自己的卷子，几乎必然高分。

解决方案：引入独立的 Evaluator Agent，专门调教成"严格挑剔模式"，与 Generator Agent 完全隔离。

这两个发现，直接引出了多 Agent 架构的第一个也是最核心的模式。

三、多 Agent 架构：五种协作模式

有些团队选模式时，依据的是听起来是否高深，而不是是否适合手头的问题。建议从可能奏效的最简单模式开始，观察它在哪里遇到困难，然后逐步演进。

模式一：生成-验证（Generator-Validator）

适合什么问题：输出质量至关重要，且评估标准能明确表述。

工作原理：Generator 生成输出 → Validator 按明确标准评估 → 不通过则附带具体反馈退回 → 循环直到通过或达到最大迭代次数。

Generator → 输出 → Validator ──通过──→ 完成 │ 不通过 + 反馈 │ └─→ Generator（下一轮）

典型场景

查看全文

http://www.cnnetsun.cn/news/2518384.html

2026年图片去水印软件哪个好用？盘点当前值得收藏的去水印工具

千问 LeetCode 2565. 最少得分子序列 Java实现

千问 LeetCode 2569. 更新数组后处理求和查询 Java实现

观察taotoken在多模型间自动路由的响应速度与成功率

基于Python + LLM的AI导演系统设计与实现

6款论文降AIGC工具亲测：AI痕迹彻底消失，这款便宜又好用

AI写作辅助软件的合规秘籍：如何界定“合理使用”与学术不端？

awesome-canvas进阶技巧：Canvas与WebGL结合开发高性能图形应用

easy-vibe 核心功能解析：解锁 Vibe Coding 的终极技巧

CANN/cannbot-skills Git差异统计

CANN/asc-devkit浮点转hif8 API

如何通过3个步骤快速掌握Java反编译界面定制：终极指南

PHP版本管理的终极解决方案：3分钟掌握phpenv多版本切换技巧

B站直播神器：神奇弹幕全方位操作指南

H5P交互式视频制作终极指南：快速创建引人入胜的互动学习内容

中小团队如何利用 Taotoken 统一管理多模型 API 密钥与成本

一天一个开源项目（第108篇）：Andrej Karpathy Skills - 用一个 CLAUDE.md 文件修复 LLM 编码的四个顽疾

免费图片去水印工具有哪些？2026 在线图片去水印软件推荐指南

3步掌握Internet Archive Downloader：突破数字图书馆限制的终极浏览器扩展工具

终极B站直播助手：3分钟搭建智能直播间，效率提升300%

CANN/pypto：MatmulAllReduce与RMSNorm融合算子

BuckyClient性能优化：sample与aggregationInterval参数调优实践

ElevenLabs支持广西话吗？2024最新实测结果曝光：仅2个API参数决定能否合成地道“梧州腔”

英伟达VR200机柜PCB价值量同比+233%：AI硬件主线如何被引爆？

从“水本原论”的时空错位看西方哲学叙事的建构与AI时代的数据霸权

SABIC工程塑料创新材料解决方案与发展前景分析

2026年，揭秘浙江废铝回收界的明星企业！

Prompt Engineering、Context Engineering 与 Harness Engineering 的异同点

8355 法还原魔方 – 解魔方不用死记公式

为什么92%的中小企业DeepSeek私有化项目卡在推理延迟＞800ms？——基于TensorRT-LLM的4层加速调优公式（含吞吐量提升3.8倍实测数据）