当前位置：首页 > news >正文

智能体的持续进化：让AI从你的每一次使用中学习

news 2026/6/12 15:37:14

智能体的持续进化：让AI从你的每一次使用中学习

当你的AI还停留在"出厂设置"时，别人的AI已经在你睡梦中吸收了全球最新文献、从每一次医患交互中积累经验、在一轮又一轮的"自我对弈"中不断进化。

这不是科幻，而是2025-2026年已在华西医院、哈工大实验室、MICCAI顶会论文中落地的真实实践。

智能体的"智力"不应该被锁定在训练完成的那一刻。在临床科研场景中，知识每4-5年就会更新一轮，一个依赖"静态知识库"的AI，半年后就会过时。因此，让AI具备持续学习与自主进化的能力，不是"锦上添花"，而是"生存必需"。

本文将从应用场景落地、学术前沿探索、技术架构演进、未来趋势展望四个维度，为你全景解析医疗AI智能体的"进化之路"。

一、应用落地：已发生的"活系统"革命

1.1 华西医院「睿宾2」：医生审核即训练

2025年12月，四川大学华西医院联合华为、润达医疗发布了睿宾2，标志着全球首个实现持续迭代的严肃医疗AI智能体正式迈入"活系统"时代。

核心机制：医生审核闭环

睿宾2构建了一个"患者提问-智能应答-专家审核-知识沉淀-能力反哺"的可信闭环。当AI生成回答后，医生对其进行审核——每一次点击确认、每一次修改纠正，都会自动形成结构化知识反哺系统，成为AI持续优化的养料。

核心理念跃迁

维度	睿宾1（静态工具）	睿宾2（活系统）
知识更新	被动维护	自我学习、动态更新
定位	应答工具	终身健康伙伴
架构	静态知识底座	多智能体架构

两大板块能力升级

系统分为"医知Dr"（临床健康管理）与"论界Schola"（智能科研辅助）两大板块：

论界Schola：新增"临床检索"功能，医生用自然语言提问复杂临床场景，系统秒级检索全球最新文献，生成证据等级清晰、附带完整溯源的结构化答案。
医知Dr：通过"使用-反馈-优化"的迭代循环，有效减少了AI生成"幻觉"内容，大幅提升了服务的可靠性与场景适应性。

进化路径：睿宾3已在排期，核心任务是打通"医知"与"论界"的独立基座，形成更高效的进化"飞轮"。下一步将与心血管、内分泌、肿瘤等更多科室展开深度合作。

1.2 联影智能：临床数据驱动的"自进化"医疗智能体

联影智能依托由文本、影像、视觉、语音、混合五大模型构成的「元智」医疗大模型，发布了十余款医疗智能体。

关键实践：核医学智能体

在西京医院、广州医科大学附属第一医院等机构的长期应用中，核医学智能体通过基于临床数据的持续迭代，性能不断优化——报告书写时间从1小时缩短至几分钟，有效减轻了文书负担。

"元医院"愿景

联影智能正在打造覆盖"元急诊、元手术室、元病房"等全场景的"元医院"，实现从数据到知识的转化，推动医疗资源普惠化与诊疗流程智能化。

1.3 吉大三院：教育场景的AI进化

2025年9月，吉林大学白求恩第三临床医学院发布了"临床医学教育AI智能体与知识库"。该系统通过数智化手段，实现了：打破传统医学教学的时空限制与资源壁垒；利用虚拟仿真还原急危重症与罕见病场景；通过AI平台生成个性化学习路径，实时分析操作数据。

二、学术前沿：让AI在模拟中"自我对弈"

2.1 MedAgentSim：自进化的多智能体模拟环境

在2025年MICCAI顶会上，研究者提出了MedAgentSim——一个开放源码的模拟临床环境，包含医生、患者和测量三个智能体。

核心创新

动态诊断流程：要求医生智能体通过多轮对话主动与患者互动，请求相关医学检查和影像结果，而非依赖静态问答数据集。
自改进机制：通过多智能体讨论、思维链推理、基于经验的检索增强，让模型在诊断更多患者的过程中渐进式学习。
记忆缓冲与经验回放：通过"医疗记录"和"经验记录"两类记忆，以及检索增强学习，实现诊断策略的迭代优化。

效果数据

在MEDQA等动态诊断评测中，LLaMA 3.3采用思维链+集成方法后，准确率获得了高达16.1%的提升。

实践启示：MedAgentSim证明了，在不需要真实患者数据的情况下，AI可以通过模拟交互实现自我进化，这对受限于数据隐私的医疗AI具有重要价值。

2.2 人机融合会诊的三部曲演进

哈工大赛尔实验室联合解放军总医院、北京天坛医院等机构，提出了面向人机融合会诊的"多智能体进化三部曲"。

第一部曲：静态组织（肝胆胰疾病）

针对肝胆胰疾病，通过自组织自学习机制，在信息不全或证据冲突的极端环境下，诊断准确率相较单一智能体提升10%以上。该成果已在全国20余省市30家机构落地。

第二部曲：动态调度（心血管疾病）

利用基于大语言模型的动态调度器，精准识别用户意图并将子任务派发至最优匹配的智能体。系统决策解释准确度达86%，确保每份诊疗建议都具备可追溯的医学逻辑。

第三部曲：动态生成（脑卒中）

突破固定编组模式，系统随证据流转与临床节点实时唤起"专家智能体"。在CMB脑卒中评测中，基于30B基座模型的系统表现超越了GPT-4o与DeepSeek-R1-671B等通用模型，准确率达到90.67%。

三、技术架构：自进化的核心机制拆解

3.1 三大核心技术路径

从上述实践与研究中，可以提炼出AI智能体持续进化的三条核心路径：

路径	核心机制	代表案例	优势
路径A：人机反馈闭环	专家审核→知识结构化→模型更新	华西睿宾2	真实场景，质量可控
路径B：模拟自博弈	多智能体模拟交互→经验回放→策略优化	MedAgentSim	不依赖真实数据
路径C：动态编排	任务感知→智能体按需唤起→知识蒸馏	哈工大"三部曲"	灵活高效，按需扩展

3.2 关键设计要素

要素一：经验回放机制

借鉴MedAgentSim的设计，系统通过"医疗记录"和"经验记录"两类记忆缓冲，在新增数据时战略性保留典型案例，防止"学新忘旧"。

要素二：知识蒸馏与增量学习

在动态知识更新中，采用"先差异检测、再增量训练、最后蒸馏保旧"的三步策略，确保新知识融入的同时不遗忘旧能力。

要素三：反馈的时效性平衡

Radiology文章强调，反馈可以是即时的（立刻纠正），也可以是延迟的（周/月级批量更新）。两者需要结合：即时反馈保障学习效率，延迟批次保障知识质量。

要素四：安全约束

Claude的研究指出，无约束的进化可能导致模型"学坏"。因此必须设置安全护栏——只学习通过专家审核的知识、设置回归测试防止能力退化、保留可回滚版本。

3.3 持续进化的评估体系

构建持续学习系统，需要建立多维度的进化评估指标：

指标维度	评估内容	评估方法
知识更新率	知识库新增/变更条目数	自动化统计
准确率趋势	诊断/分析准确率随时间变化	定期盲测
幻觉率	AI编造内容的频率变化	专家抽检
用户采纳率	医生采纳AI建议的比例	行为日志分析
反馈闭环率	专家审核反馈的完成度	系统追踪