当前位置: 首页 > news >正文

大模型实战项目:基于大模型+知识图谱的知识库问答 (附项目)

今天给大家介绍一个git开源的宝藏项目 — 基于大模型+知识图谱的知识库问答,这里还搭配了一个演示dome给大家,如需要此项目练手的,我已经打包好了放在文末~

基于大模型+知识图谱的知识库问答系统

项目整体流程介绍

项目整体包含5个部分:数据重构、图谱构建、图谱补全、对话模型、网页承载

首先是数据构建的逻辑

然后利用数据和ChatGPT定义的规则构建种子知识图谱

接下来对种子知识图谱进行补全操作(需要对自己的数据进一步的筛选,有洞察的认知)

利用chatglm-6b作为核心模型,基于flask构建框架的对话模型

前端界面构建和项目部署

环境配置


python 3.8.16 torch 1.11.0+cu113~ paddlenlp 2.5.1 paddlepaddle-gpu 2.3.2 transformer2.6.0

初始模型:


种子知识图图谱模型:paddlenlp-model-zoo-uie 所用模型类型:‘信息提取’

训练模型:SPN4RE-NYT—精确


训练集参与:50% 验证集参与:10% 测试集参与:40%

数据来源:


初始数据:《舰船损管和潜水技术》 新增数据:《舰船损管技术》等

数据标注

利用doccanco不同类型的数据约100条作为警示uie的初始数据,在uie进行初次抽取后,针对数据中效果较差的部分进行二次标注。

训练设备:3090 * 2

👉CSDN大礼包🎁:此项目已打包《基于图知识谱和知识库的模型对话系统》免费分享**(安全链接,放心点击)**👈

http://www.cnnetsun.cn/news/859799.html

相关文章:

  • SEW变频器MCV41A0220-503-4-0T 08275033
  • 手动加锁解锁版本catch里解锁结果正确分析
  • AI写专著大揭秘:优质工具推荐,让你轻松完成专业学术著作!
  • 如何在 Ubuntu 22.04 上利用 NVIDIA A100 显卡进行深度学习训练任务的分布式计算,提升大数据处理能力
  • 【Arm】MDK如何生成ELF文件
  • TypeScript学习-第3章:复合类型
  • 【AutoCAD二次开发】一键获取CAD块信息!实用技巧大公开
  • 物联网控制面板多设备联动测试:软件测试从业者的实战指南
  • 2026毕设ssm+vue美食推荐系统app论文+程序
  • 嘉立创EDA:自动升级软件下载下来的安装包存放在什么地方
  • SOC一级分析师告警分诊失效:企业网络安全的核心级风险
  • Java springboot基于微信小程序的宠物服务预约系统宠物用品(源码+文档+运行视频+讲解视频)
  • AI写论文有妙招,这4款AI论文写作工具,为你的论文质量保驾护航!
  • ‌AI透明度报告:测试员如何给黑箱模型做X光?‌
  • Claude Code Slash Commands:从“提问者“到“指令设计师“的蜕变
  • AI个人色彩分析工具:发现你的专属色盘
  • 章节 3:K8S 核心组件工作原理(控制平面)
  • Python序列协议深度解析:从抽象类到自定义序列实现
  • 自指AI安全协议草案:为具备自我认知的智能系统建立存在边界V0.1
  • web学习练习题
  • 从隐私合规到地图创新:腾讯地图SDK的隐私协议深度解析与实践指南
  • Qwen3-VL-8B-Instruct-GGUF实操手册:GGUF格式加载速度与显存占用实测
  • 图解说明VDMA工作原理:入门级配置操作指南
  • GTE中文-large部署教程:从start.sh脚本解析到环境变量全局配置最佳实践
  • CogVideoX-2b环境配置:AutoDL镜像一键启动详细步骤
  • 企业级语音方案:GLM-TTS在智能播报中的应用
  • ChatTTS语音样本展示:多种音色种子下的表达差异
  • Nano-Banana工业应用:ISO/IEC标准文档配套插图AI生成流程
  • Qwen1.5-0.5B-Chat量化推理:INT8精度部署实战
  • YOLO X Layout效果展示:手写签名与印刷体Text共存区域的Mask级分离效果