AI智能体与领域模型微调建设项目
冶金行业智能体与领域模型微调建设项目
领域智能体 · 大模型训练 · 微调实践
一、开场介绍
大家好,最近我聚焦冶金领域,围绕行业专属智能体开发、大模型训练与微调工作开展了一系列实践,接下来就把这段时间的阶段性成果和思考,跟大家做个简单分享。
二、项目背景
当前冶金行业平台已积累大量行业文档数据,传统检索功能能够满足基础信息查询需求,整体效果稳定可靠。
但平台目前尚不具备 AI 相关能力,在内容理解、智能问答、知识推理、多源信息整合等方面仍有提升空间。
本次工作主要围绕大模型与领域智能体展开,通过引入 AI 能力,进一步提升冶金行业平台的智能化水平与用户使用体验。
三、系统模块划分与 API 调用逻辑
整个架构分三层:最上方是项目需求(智能问答、智能问数、报告写作、智能检索、文献理解、机器翻译);中间是知识库、多模态数据抽取与 API 调用,共同构成知识与中台能力;最下方是通用组件,负责登录、权限、存储等基础运维。需求驱动上层能力落地,全产品依赖知识库与数据抽取链路,通用组件保障稳定运行。
图:系统模块划分与 API 调用逻辑(第一层项目需求;第二层知识库、多模态数据抽取、API 调用;第三层通用组件:登录、权限、存储、运维)
四、演示并强调页面嵌入与复用
以下能力可通过统一门户或 页面嵌入(如 iframe,qiankun)复用,并与 SSO、知识库衔接,保持体验一致、降低重复开发。
SSO登录 | 单点登录对接,统一身份与入口安全。 |
知识库 | 领域文档与结构化知识的统一存储与检索底座。 |
智能问答 | 基于知识库与模型的多轮对话与溯源回答。 |
智能检索 | 语义与关键词结合的文献、资料智能检索。 |
报告写作 | 行业报告起草、润色与结构辅助。 |
智能问数 | 面向数据与指标的自然语言查询与分析辅助。 |
文献理解 | 长文摘要、要点提取与结构化理解。 |
机器翻译 | 多语言内容转换,服务检索与国际交流场景。 |
五、模型训练与领域微调(规范流程)
面向国产化操作系统与算力环境,将「数据—格式—训练—评测—部署」串成可复用的领域微调链路;推理侧以统一推理服务为基座,训练侧以主流微调工具为主线。
1. 环境与推理基座
适配国产化操作系统与算力栈;部署推理服务,完成基座模型选型与吞吐、延迟等验证,为后续微调目标与部署形态定标。
2. 语料与数据合成
多模态数据抽取产出规范化 Markdown 语料,经数据合成流水线做指令/对话样本合成与增广,形成可版本管理的训练集。
3. 训练数据格式化
编写脚本将语料转换为训练工具要求的微调数据格式(字段约定、角色与对话结构一致),保证训练可读、可审计、可复现。
4. 模型微调训练
在微调工具中配置训练(如 LoRA / 全参等按资源与效果选择),在国产化环境下完成训练任务编排与模型版本管理。
5. 评测与上线
开展离线评测与业务向抽检;通过后对接统一推理网关完成部署与版本发布,纳入日常监控与回滚策略。
六、收尾总结
以上工作可归纳为以下几方面:
- 在海量行业文档与既有检索能力之上,补齐理解、问答、推理与多源整合等 AI 能力,推动冶金行业平台向智能化服务演进。
- 三层架构将「六项业务能力—知识库与多模态抽取、API—登录与权限、存储与运维」分层落实:上层对接场景,中层统一知识与接口,下层夯实通用底座。
- 通过 SSO 与页面嵌入,把知识库、智能问答与问数、检索与报告、文献理解与翻译等能力按序接入门户,体验一致、集成成本低。
- 在国产化算力环境下,走通「Markdown 语料 → 数据合成 → 脚本格式化 → 模型训练 → 评测与推理部署」的领域微调闭环,与业务架构形成配套。
- 由此形成可复用的组件、接口与数据—模型流水线,既满足当前建设目标,也便于后续扩展场景与迭代模型。
视频地址:https://www.bilibili.com/video/BV1SNEc6YEJn/?vd_source=14bcff2edf395c30f806c2424102e70c
