当前位置：首页 > news >正文

Semantic Kernel+Neo4j轻量级知识问答系统实战

news 2026/7/2 18:45:55

1. 项目概述：为什么一个轻量级知识问答系统值得花三天时间搭出来

我最近在给一家做工业设备维保的客户做技术咨询，他们手上有几百份PDF格式的设备手册、故障代码表和维修日志，但工程师查个“PLC模块报E207错误怎么处理”，得先打开Word搜索关键词，再翻三份文档比对，最后在微信群里问老同事——整个过程平均耗时8分钟。这不是个例。上周我翻了17家中小制造企业的IT需求清单，有12家明确写了“希望把散落的技术文档变成能直接提问的答案”。这时候，“基于语义内核（Semantic Kernel）与 Neo4j 构建轻量级知识问答系统”就不是一句技术口号，而是一套能当天部署、次日见效的解决方案。

这个系统的核心价值，在于它绕开了传统大模型问答的两个硬伤：一是不依赖GPU服务器，一台16GB内存的开发机就能跑；二是答案可追溯、可验证。用户问“冷却泵异响的可能原因”，系统不会生成一段似是而非的解释，而是从Neo4j图谱里精准拉出“冷却泵→振动异常→轴承磨损→润滑不足→维护周期超期”这条路径，并附上对应手册页码和维修记录时间戳。这背后是Semantic Kernel做的语义路由——它把自然语言问题拆解成图查询意图，再由Neo4j用毫秒级响应把结构化知识“具象化”出来。你不需要懂Cypher语法，也不用调参微调大模型，只需要把PDF转成带章节标记的文本，再定义好“设备-故障-原因-措施”这几个节点类型，剩下的交给这套组合拳。它适合技术文档多、更新快、但预算有限的团队，比如医疗设备售后、教育机构课件管理、甚至律所的案例库检索。我试过用它处理523页的《西门子S7-1200编程手册》，从数据导入到能回答“如何用DB块实现多任务同步”，全程不到2小时，而且所有答案都能点开溯源。

2. 整体设计思路：为什么选Semantic Kernel而不是LangChain，又为什么非用Neo4j不可

2.1 Semantic Kernel不是另一个LLM框架，而是“意图翻译器”

很多人看到Semantic Kernel第一反应是：“又一个LangChain竞品？”其实完全不是。LangChain像一个功能齐全的瑞士军刀，插件多、配置复杂，要自己拼装记忆模块、重排模块、输出解析器；而Semantic Kernel更像一把高精度车床——它不负责生成内容，只专注做一件事：把人类问句精准翻译成系统能执行的指令。举个例子，用户问“上次更换液压油是什么时候？”，LangChain可能需要你写提示词模板、设置few-shot示例、再加个正则提取日期；而Semantic Kernel通过Planner+Function Calling机制，会自动识别出这是个“查询历史记录”的意图，触发预定义的GetMaintenanceHistory函数，并把“液压油”映射为图谱中的EquipmentNode: {type: "fluid", name: "hydraulic_oil"}。这个过程不需要训练，靠的是开发者提前注册的语义函数（Semantic Functions），也就是用自然语言写的JSON Schema描述的API接口。我实测过，同样处理100条设备维保类问题，Semantic Kernel的意图识别准确率比LangChain默认配置高23%，因为它的Planner是微软专门针对企业知识场景优化过的，内置了对“时间状语”“设备型号缩写”“故障代码前缀”的识别规则。

2.2 Neo4j不是为了赶时髦，而是解决“关系爆炸”问题的刚需

为什么不用MySQL或Elasticsearch？因为技术文档里的知识不是孤立的。比如“变频器过热”这个故障，它关联着“散热风扇故障”“环境温度>40℃”“参数P0004设置错误”三个不同维度的原因，而每个原因又各自连着不同的解决方案、检测步骤和责任人。如果用关系型数据库，你需要建七八张关联表，一次查询要JOIN五次以上；用ES虽然搜索快，但无法表达“A导致B，B加剧C，C被D抑制”这种因果链。Neo4j的图模型天然适配这种网状知识：节点是实体（设备、故障、部件、参数），关系是动词（causes, requires, located_in, last_maintained_on）。更关键的是，它的Cypher查询语言让“找所有可能导致冷却系统失效的二级原因”这种复杂逻辑，写成一行代码就能跑——MATCH (f:Fault)-[:CAUSES*2]->(r:RootCause) WHERE f.name = 'cooling_failure' RETURN r。我在测试中对比过：同样查询“与PLC电源模块相关的所有已知故障及对应固件版本”，Neo4j平均响应12ms，MySQL需要380ms（涉及4张表JOIN），ES返回结果虽快但无法体现故障间的传导路径。这不是性能数字游戏，而是决定了用户是否愿意继续提问——人对延迟的容忍阈值是200ms，超过这个数，用户就会觉得系统“卡”，进而放弃使用。

2.3 “轻量级”的真实含义：资源占用、部署复杂度、维护成本三维压缩

所谓轻量级，不是指功能缩水，而是把资源消耗压到最低。Semantic Kernel运行在.NET 6+或Python 3.9+环境，核心进程内存占用稳定在350MB以内；Neo4j Community Edition单机版，8GB内存机器上可轻松承载50万节点、200万关系的数据量。整个系统没有中间件依赖，不需要Kafka消息队列，不强制要求Redis缓存——所有状态都存在Neo4j里，重启服务后知识图谱自动加载。部署时，我用Docker Compose写了个三行配置：neo4j服务挂载本地data目录，sk-service暴露8080端口，前端Vue静态文件用Nginx代理。客户IT人员照着README执行docker-compose up -d，15分钟完成上线。反观某些基于向量数据库的方案，光是安装Milvus就要处理CUDA驱动兼容性，微调Embedding模型得租用A10显卡服务器。我们这套方案最大的维护成本，其实是定期更新PDF文档——我把这个流程也自动化了：用Python脚本监听指定文件夹，新PDF进来自动触发OCR（用PaddleOCR）、文本切片（按标题层级）、实体抽取（用spaCy训练的领域NER模型），最后批量写入Neo4j。整个流水线跑一次，比人工复制粘贴还快。

3. 核心细节解析：从PDF文档到可问答图谱的七步转化链

3.1 文档预处理：别让扫描件毁掉整个知识库

90%的知识问答系统失败，根源在第一步——文档质量。我见过最离谱的案例：客户提供的“设备手册”是手机拍的扫描件，分辨率72dpi，文字边缘全是锯齿。直接丢进OCR，识别出的“P1001”变成“P100l”，“Ω”符号全识别成“Q”。所以预处理必须前置。我的标准流程是：先用OpenCV做图像增强——自适应直方图均衡化（CLAHE）提升对比度，非局部均值去噪（cv2.fastNlMeansDenoisingColored），再用二值化算法（Otsu阈值）生成清晰黑白图。对于PDF，优先用pdfplumber解析原生文本层，只有当pdfplumber返回空时才走OCR流程。这里有个关键技巧：PaddleOCR的PP-Structure模型能同时识别文本和表格，但默认配置会把手册里的“参数表”识别成一堆零散文字。我修改了layout_dict.json，把table类型权重调高到0.9，确保“参数名|默认值|范围|说明”这种四列表格能完整保留结构。实测下来，经过这套预处理，OCR错误率从12.7%降到1.3%，特别是对西门子、三菱这类厂商的手册专用符号（如“→”“⇒”“□”）识别准确率接近100%。

3.2 知识建模：用三类节点撑起整个技术世界

Neo4j不是把文档扔进去就行，必须设计符合业务认知的图谱模式。我摒弃了学术界常用的“本体建模”，采用工程师思维定义三类核心节点：

DocumentNode：代表原始文档，属性包括file_path、version、last_updated、source_system（来自ERP还是微信公众号）。这是所有知识的源头锚点。
ConceptNode：技术概念实体，比如“变频器”“PID调节”“Modbus RTU”。关键属性是canonical_name（标准化名称，解决“VFD”“变频驱动器”“AC drive”同义问题）和domain（所属领域，如“电气”“机械”“软件”）。
RelationEdge：不是简单的“HAS”或“IS_A”，而是带业务语义的关系，比如：
- CAUSES：故障A导致故障B（权重字段severity: 0.8）
- REQUIRES_CHECK：处理故障需检查的部件（direction: "before"）
- OBSOLETED_BY：旧参数被新参数替代（valid_since: "2023-01-01"）

这个模型的优势在于，它能让问答系统理解“为什么”。用户问“为什么升级固件后通讯中断？”，系统不是返回固件说明文档，而是遍历OBSOLETED_BY关系找到被替代的参数，再顺着REQUIRES_CHECK关系定位到需要重新配置的通讯地址寄存器。我在头歌平台教Neo4j课程时，学生常问“为什么要定义这么多关系类型”，我的回答是：“当你需要回答‘哪些操作会加剧这个故障’时，EXACERBATES关系就是答案的唯一入口。”

3.3 语义函数注册：把业务逻辑翻译成机器能懂的“普通话”

Semantic Kernel的威力，全在Planner调用的语义函数。这些函数不是AI生成的黑盒，而是开发者用代码明确定义的业务规则。以“查询故障处理步骤”为例，我注册的函数长这样：

@sk.function("troubleshooting", "get_steps_for_fault") def get_steps_for_fault(fault_name: str, equipment_id: str = None) -> str: """ 根据故障名称和设备ID，返回结构化处理步骤 输入：fault_name="电机过热", equipment_id="MOT-203" 输出：JSON字符串，含step_number, action, required_tool, safety_warning """ # 1. 在Neo4j中查找匹配的故障节点 query = """ MATCH (f:ConceptNode {canonical_name: $fault_name}) OPTIONAL MATCH (f)-[r:HAS_SOLUTION]->(s:Solution) RETURN s.step_number as step_num, s.action as action, s.required_tool as tool, s.safety_warning as warning ORDER BY s.step_number """ result = neo4j_session.run(query, fault_name=fault_name) # 2. 组织成前端可渲染的JSON steps = [] for record in result: steps.append({ "step_number": record["step_num"], "action": record["action"], "required_tool": record["tool"] or "无", "safety_warning": record["warning"] or "" }) return json.dumps(steps, ensure_ascii=False)

重点在于：这个函数里没有LLM调用，纯数据库查询。Planner收到用户问题后，会根据函数描述里的关键词（“故障”“处理步骤”“结构化”）自动匹配到这个函数，并把用户提到的故障名作为参数传入。我故意没用LLM生成步骤描述，因为维修步骤必须100%准确——任何“可能”“建议”“通常”都是安全隐患。所有步骤都来自手册原文，只是用Cypher做了结构化提取。

3.4 查询意图解析：Planner如何把“PLC没反应”变成Cypher语句

Semantic Kernel的Planner不是魔法，它依赖高质量的函数描述和示例。我给get_fault_causes函数写的描述是：“当用户询问某个故障的可能原因时调用，输入为故障标准化名称，输出为原因列表，每个原因包含严重等级和验证方法。示例：用户说‘伺服电机抖动怎么办’，应调用此函数，参数fault_name=‘伺服电机抖动’。” 这段描述里埋了三个关键信号：

“可能原因” → 触发CAUSES关系查询
“严重等级” → 要求返回relation.severity属性
“验证方法” → 需要关联到VerificationStep节点

Planner内部会把描述转成向量，与用户问题向量做相似度计算。但单纯靠向量容易误判，所以我加了规则引擎兜底：当用户问题包含“怎么办”“怎么处理”“如何解决”时，强制路由到troubleshooting函数族；当出现“哪个”“哪些”“有什么”时，优先走exploration函数族。这个混合策略让意图识别准确率从89%提升到96%。实际部署中，我还加了日志埋点：记录每次Planner选择的函数、输入参数、实际执行耗时。某天发现“PLC没反应”总被路由到get_equipment_status函数（查设备在线状态），而不是get_fault_causes。排查发现，手册里“PLC没反应”被归类为“通讯故障”，而函数描述里写的是“硬件故障”。改了一个词，问题解决。

4. 实操过程：从零开始搭建的完整流水线（含所有命令与配置）

4.1 环境准备：避开Neo4j安装的五个经典坑

Neo4j Desktop安装包官网下载确实方便，但生产环境我坚持用Docker——因为Desktop的Java版本、内存配置、插件管理全是黑盒。以下是我在Ubuntu 22.04上验证过的最小可行配置：

# 1. 创建持久化目录（别用/home/xxx，权限容易出问题） sudo mkdir -p /opt/neo4j/data /opt/neo4j/logs # 2. 拉取官方镜像（别用latest，用4.4.28这个LTS版本） docker pull neo4j:4.4.28 # 3. 启动容器（关键参数详解）： docker run \ --name neo4j-prod \ -p 7474:7474 -p 7687:7687 \ # HTTP和Bolt端口 -d \ -e NEO4J_AUTH=neo4j/password123 \ # 必须设密码，否则启动失败 -e NEO4J_dbms_memory_pagecache_size=2G \ # 内存缓存，设太小会慢 -e NEO4J_dbms_connectors_default__listen__address=0.0.0.0 \ # 允许外部访问 -v /opt/neo4j/data:/data \ -v /opt/neo4j/logs:/logs \ neo4j:4.4.28

提示：Windows用户注意，Neo4j 4.x要求WSL2，别在Docker Desktop的Hyper-V模式下硬刚。如果遇到“Failed to start Neo4j with an error: java.lang.OutOfMemoryError”，不是内存不够，而是NEO4J_dbms_memory_heap_initial__size和NEO4J_dbms_memory_heap_max__size没设一致。我的经验是：16GB物理内存机器，设成4G最稳。

启动后，浏览器访问http://localhost:7474，用neo4j/password123登录。首次进入会提示改密码，必须改，否则Semantic Kernel连接时会报错AuthenticationException。改完密码后，执行CALL dbms.components()确认版本，再跑CREATE (:TestNode {name:"hello"})测试写入是否正常。

4.2 数据导入：用Python脚本批量注入知识图谱

手动在Neo4j Browser里敲Cypher建节点？那500页手册得干到明年。我写了个import_knowledge.py脚本，核心逻辑分三步：

# 步骤1：解析PDF，提取带层级的文本块 def parse_pdf_to_sections(pdf_path): doc = fitz.open(pdf_path) sections = [] for page in doc: blocks = page.get_text("blocks") # 获取文本块，保留位置信息 for b in blocks: if len(b[4].strip()) > 20: # 过滤短文本和页眉页脚 # 用字体大小判断标题层级（h1/h2/h3） font_size = get_font_size_from_block(b) sections.append({ "text": b[4].strip(), "level": 1 if font_size > 16 else 2 if font_size > 14 else 3, "page": page.number }) return sections # 步骤2：识别节点类型，生成Cypher语句 def generate_cypher_statements(sections): statements = [] for sec in sections: if sec["level"] == 1 and "故障" in sec["text"]: # 一级标题含“故障”，创建ConceptNode name = extract_fault_name(sec["text"]) # 如“1.2.3 变频器过热故障” statements.append( f"MERGE (n:ConceptNode {{canonical_name: '{name}'}}) " f"ON CREATE SET n.type='fault', n.source_file='{pdf_path}'" ) elif sec["level"] == 2 and "原因" in sec["text"]: # 二级标题含“原因”，建立CAUSES关系 causes = extract_causes(sec["text"]) for cause in causes: statements.append( f"MATCH (f:ConceptNode {{canonical_name: '{name}'}}), " f"(c:ConceptNode {{canonical_name: '{cause}'}}) " f"MERGE (f)-[r:CAUSES]->(c) " f"ON CREATE SET r.severity=0.7" ) return statements # 步骤3：批量执行（避免单条提交太慢） def batch_execute(statements): with driver.session() as session: # 分批，每批200条 for i in range(0, len(statements), 200): batch = statements[i:i+200] # 用UNWIND一次性执行，比循环快10倍 session.run("UNWIND $batch AS stmt FOREACH(x IN [1] | " + "CALL apoc.cypher.doIt(stmt, {{}}) YIELD value RETURN 1)", batch=batch)

运行命令：python import_knowledge.py ./manuals/siemens_vfd.pdf。脚本会自动创建DocumentNode，提取所有一级标题为ConceptNode，二级标题“原因”“处理”“预防”分别建立CAUSES、HAS_SOLUTION、PREVENTS关系。实测导入200页PDF，耗时4分32秒，生成1.2万个节点、3.8万条关系。

4.3 Semantic Kernel服务搭建：.NET Core版的极简配置

虽然Semantic Kernel支持Python，但.NET版性能更稳（.NET 6的JIT编译对高频函数调用优化更好）。我的Program.cs精简到23行：

var builder = WebApplication.CreateBuilder(args); // 1. 注册Neo4j驱动 builder.Services.AddSingleton<INeo4jDriver>(sp => GraphDatabase.Driver("bolt://localhost:7687", AuthTokens.Basic("neo4j", "password123"))); // 2. 注册Semantic Kernel var kernel = Kernel.Builder.Build(); kernel.Config.AddAzureChatCompletionService( "gpt-35-turbo", // 用Azure OpenAI，国内可换为通义千问API "your-endpoint", "your-key"); // 3. 加载语义函数（从resources/functions目录） var functions = kernel.ImportSemanticFunctionsFromDirectory( Path.Combine(Directory.GetCurrentDirectory(), "resources", "functions"), "troubleshooting"); kernel.RegisterCustomFunction("troubleshooting", functions); var app = builder.Build(); app.MapPost("/ask", async (HttpContext context) => { var question = await JsonSerializer.DeserializeAsync<AskRequest>(context.Request.Body); var result = await kernel.RunAsync(question.Text, "troubleshooting"); await context.Response.WriteAsJsonAsync(new { answer = result.ToString() }); }); app.Run();

关键点：ImportSemanticFunctionsFromDirectory会自动读取resources/functions/troubleshooting/get_steps_for_fault.sk文件，这个文件是纯文本，内容如下：

{{char}}你是一个工业设备维修专家，严格按手册原文回答问题。不要编造、不要推测。 {{input}}用户问题：{{$input}} {{output}}返回JSON数组，每个元素含step_number, action, required_tool, safety_warning

这就是Semantic Kernel的“语义函数”——没有代码，只有自然语言指令。Planner会把它编译成可执行的Prompt模板。

4.4 前端集成：用Vue3三步实现对话界面

前端不用复杂框架，一个index.html加Vue3 CDN就能跑：

<div id="app"> <div class="chat-container"> <div v-for="msg in messages" :key="msg.id" :class="['message', msg.role === 'user' ? 'user' : 'bot']"> <strong>{{ msg.role === 'user' ? '我' : '系统' }}：</strong> <div v-html="formatAnswer(msg.content)"></div> </div> </div> <input v-model="inputText" @keyup.enter="sendQuestion" placeholder="输入问题，如：变频器过热怎么处理？" /> </div> <script> const { createApp, ref, onMounted } = Vue; createApp({ setup() { const messages = ref([]); const inputText = ref(''); const sendQuestion = async () => { if (!inputText.value.trim()) return; messages.value.push({ id: Date.now(), role: 'user', content: inputText.value }); inputText.value = ''; try { const res = await fetch('/ask', { method: 'POST', headers: { 'Content-Type': 'application/json' }, body: JSON.stringify({ text: inputText.value }) }); const data = await res.json(); messages.value.push({ id: Date.now()+1, role: 'bot', content: data.answer }); } catch (e) { messages.value.push({ id: Date.now()+1, role: 'bot', content: '系统忙，请稍后再试' }); } }; return { messages, inputText, sendQuestion }; } }).mount('#app'); </script>

重点在formatAnswer函数：它把后端返回的JSON字符串渲染成带编号的步骤列表，并把safety_warning字段用红色高亮。用户看到的不是冷冰冰的JSON，而是可直接执行的维修指南。

5. 常见问题与排查技巧实录：那些文档里不会写的血泪教训

5.1 Neo4j查询慢？先查这四个隐藏开关

Neo4j默认配置是为通用场景设计的，知识图谱查询必须调优。我整理了最常被忽略的四个参数：

参数名	默认值	推荐值	影响说明
`dbms.memory.heap.initial_size`	512m	4g	JVM堆内存，设太小会导致GC频繁，查询卡顿
`dbms.memory.pagecache.size`	512m	2g	页面缓存，决定多少图数据能常驻内存，直接影响MATCH速度
`dbms.connector.bolt.enabled`	true	true	必须开启，Semantic Kernel用Bolt协议连接
`dbms.security.auth_enabled`	true	true	关闭后Semantic Kernel连接报错，不是性能问题而是认证失败

修改方法：编辑/opt/neo4j/conf/neo4j.conf，取消对应行注释并修改值，然后docker restart neo4j-prod。我曾遇到一个案例：客户说“查故障原因要5秒”，登录服务器发现top显示Java进程CPU只有10%，但iostat -x 1显示磁盘await高达200ms——根本不是CPU瓶颈，而是页面缓存太小，每次查询都要从磁盘读数据。把pagecache.size从512m调到2g后，响应降到80ms。

5.2 Semantic Kernel调用失败？90%是这三个配置陷阱

陷阱1：Neo4j密码含特殊字符
如果Neo4j密码是P@ssw0rd!2024，在连接字符串里必须URL编码：AuthTokens.Basic("neo4j", "P%40ssw0rd%212024")。否则会报Invalid credentials，但错误日志里不提示具体原因。
陷阱2：函数描述里用了绝对路径
resources/functions/troubleshooting/get_steps_for_fault.sk文件里，如果写{{input}}请参考《西门子VFD手册》第32页，Planner会把“西门子VFD手册”当成关键词匹配，导致意图识别偏移。正确做法是用占位符：{{input}}请参考{{$manual}}第{{$page}}页。
陷阱3：Planner找不到函数
日志显示Planner could not find function for intent，大概率是函数注册时命名不一致。kernel.ImportSemanticFunctionsFromDirectory(..., "troubleshooting")里的"troubleshooting"必须和文件夹名、函数名里的命名空间完全一致（区分大小写）。我曾把文件夹名写成Troubleshooting，调试了两小时才发现。

5.3 知识图谱“答非所问”？本质是节点歧义没处理

用户问“PLC通讯不上”，系统返回“检查网线”，但手册里明明写着“先确认Modbus地址是否冲突”。问题出在节点标准化。原始文档里，“PLC通讯不上”被抽成ConceptNode{name: "PLC通讯不上"}，而“Modbus地址冲突”是另一个节点{name: "Modbus地址冲突"}，两者间没有CAUSES关系——因为预处理脚本没识别出“通讯不上”是“Modbus地址冲突”的上位故障。解决方案是加一层“故障聚类”：用余弦相似度计算所有故障节点的文本向量，把相似度>0.85的节点合并，并建立IS_A关系。我用sentence-transformers的paraphrase-multilingual-MiniLM-L12-v2模型，对500个故障名做聚类，最终把217个故障名压缩成63个标准化概念，CAUSES关系准确率提升37%。

5.4 安全警告：千万别在生产环境用默认配置

Neo4j默认开启dbms.connectors.default_listen_address=0.0.0.0，意味着任何能访问该IP的人都能连上数据库。Semantic Kernel服务如果和Neo4j在同一台机器，应该用127.0.0.1连接，而不是localhost（后者可能走IPv6）。更稳妥的做法是加网络隔离：

# 创建专用网络 docker network create knowledge-net # 启动Neo4j时加入网络 docker run --network knowledge-net --name neo4j-prod ... # 启动SK服务时也加入同一网络 docker run --network knowledge-net --name sk-service ...

这样Neo4j只对knowledge-net内的容器开放，外部无法直接访问。我在某次渗透测试中发现，未隔离的Neo4j实例能被扫描工具直接抓取所有节点标签，泄露整个知识体系结构。

6. 实战效果与扩展思考：从问答系统到智能维保助手的进化路径

这套系统上线两周后，客户反馈最集中的不是“答案准不准”，而是“终于不用反复切换窗口了”。工程师平均单次查询耗时从8分钟降到42秒，其中35秒是阅读答案，7秒是系统响应。这个数字背后是设计哲学的胜利：不追求“AI感”，而追求“工具感”——就像一把扳手，拿起来就知道怎么用，用完就放回工具箱，不期待它跟你聊天。

但这只是起点。我正在帮客户做三个延伸：

实时告警联动：把设备IoT平台的报警消息（如“冷却泵压力<0.3MPa”）作为输入，自动触发get_causes_for_pressure_low函数，推送可能原因到企业微信，并附上“立即检查”按钮，点击直达Neo4j Browser的对应查询页面。
维修记录反哺：工程师在移动端APP填写维修报告时，选择“故障类型”会自动加载图谱里的标准概念，避免“电机抖动”“马达晃动”“轴震动”等不一致表述，新记录自动作为OBSERVED_CAUSE关系写入图谱，形成知识闭环。
多源知识融合：把ERP里的备件库存数据、CRM里的客户合同服务等级（SLA），用APOC插件的apoc.load.jdbc定时同步到Neo4j，用户问“这个故障修多久”，系统不仅能答技术步骤，还能结合SLA和库存，给出“预计4小时，因主控板有现货”。

最后分享个小技巧：Semantic Kernel的Planner日志里，有一项plan_json字段，记录了它生成的完整执行计划。我把它存到Elasticsearch里，每天用Kibana看“哪些问题被路由到fallback函数”，就能发现知识图谱的盲区——比如连续三天“接地电阻不合格”都被路由到通用回答函数，说明图谱里缺少这个故障的专项处理流程，立刻安排补充。知识系统不是建完就结束，而是用真实问题流持续打磨的过程。我常说，最好的知识图谱，是那个让工程师忘记自己在用图数据库的图谱。

查看全文

http://www.cnnetsun.cn/news/3106977.html