当前位置: 首页 > news >正文

内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

数据集概述

在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。

数据集核心规格:高质量标注,多格式兼容

本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:

  • 数据规模与多样性:包含9248张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
  • 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8%,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
  • 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。

核心使用场景:覆盖医疗 AI 全链路研发

数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:

  1. 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
  2. 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
  3. 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。

数据集训练指标

训练图:

标签信息:

AP MP

1. AP:最常见为「腺瘤性息肉(Adenomatous Polyp)」

  • 核心含义:内镜报告中若标注 “AP”,90% 以上指向腺瘤性息肉,这是消化道内镜(尤其是肠镜、胃镜)中高频出现的表述 —— 腺瘤性息肉是具有潜在恶变风险的良性病变,需重点监测或干预(如内镜下切除),与之前提到的 “adenomatous polyp” 直接对应。

  • 场景示例:肠镜报告中 “升结肠见 1 枚 AP,直径 0.6cm”,即 “升结肠发现 1 枚腺瘤性息肉,大小 0.6 厘米”。

2. MP:需结合内镜类型区分,核心有 2 类常见含义

(1)消化道内镜:多为「增生性息肉(Hyperplastic Polyp)」

  • 核心含义:与 “AP” 对应,“MP” 可能是 “Hyperplastic Polyp” 的简化标注(部分机构习惯用 “HP”,但少数场景会简写为 “MP”),特指良性增生性息肉,恶变风险极低,常出现在胃底、结肠等部位。

  • 场景示例:胃镜报告 “胃底多发 MP,直径 0.2-0.3cm”,即 “胃底有多个增生性息肉,大小 0.2-0.3 厘米”。

(2)支气管镜 / 喉镜:可能为「中叶(Middle Lobe)」

  • 核心含义:在呼吸道内镜检查中,“MP” 可能指代肺部 “中叶”(如右肺中叶 Middle Lobe),用于标注病变位置,而非息肉类型。

  • 场景示例:支气管镜报告 “MP 开口处黏膜充血”,即 “右肺中叶开口处黏膜有充血表现”。

数据集拆分

训练集:
6477图片
验证集
1844图片
测试集
927图片

预处理

自动定向: 应用
调整大小: 拉伸至 640x640

增强

未进行任何增强。

数据集图片和标注信息:

数据集下载地址:

yolo v12: https://download.csdn.net/download/pbymw8iwm/92466308

yolo v11:https://download.csdn.net/download/pbymw8iwm/92466420

yolo v9: https://download.csdn.net/download/pbymw8iwm/92466315

yolo v8:https://download.csdn.net/download/pbymw8iwm/92466318

yolo v7: https://download.csdn.net/download/pbymw8iwm/92466733

yolo v5: https://download.csdn.net/download/pbymw8iwm/92466738

coco json: https://download.csdn.net/download/pbymw8iwm/92466756

pascal voc xml: https://download.csdn.net/download/pbymw8iwm/92466742

yolo darknet: https://download.csdn.net/download/pbymw8iwm/92466746

http://www.cnnetsun.cn/news/91966.html

相关文章:

  • Memgraph 全新 AI 图工具包:一键构建 GraphRAG 聊天机器人,实现快速上下文感知响应
  • 初始化列表和特殊成员
  • (二)前端基础框架构建
  • vLLM推理引擎教程6-Nsight Systems性能分析
  • 基于MATLAB的燃料电池汽车参数匹配与能量管理策略优化及仿真模型研究资料库
  • AM247L-0000伺服电机
  • DoraemonKit(DoKit)使用教程:从集成到实战
  • 构筑 AI 理论体系:深度学习 100 篇论文解读 第十九篇:序列建模的焦点——注意力机制 Attention Mechanism (2015)
  • 【小白笔记】移除元素与删除有序数组中的重复项与轮转数组(三步反转)
  • 什么是关键字驱动测试?
  • 前沿技术借鉴研讨-2025.12.16(超声心动图综述/妊娠期糖尿病/降低CTG解读主观性)
  • 别让发成绩,耗掉你课后的半小时
  • 企业级 Prompt 管理中心:实验分流 + 曝光埋点 + 可回溯,版本化/AB/DSL/可观测全齐
  • 执行 install.sh 报错 `env: ‘bash\r‘: No such file or directory` 怎么解决?
  • Part 10|我给这套系统划的第一个边界
  • agent-zh.md
  • 为什么过滤 rtmpt 而不是 rtmp?
  • Navicat x 达梦技术指引 | 启用和配置AI助手
  • Transformer的注意力权重的理解
  • 解构 Codigger:从内核到无限生态的“进化阶梯”
  • 基于Python的高考志愿报名推荐系统源码设计与文档
  • 飞桨PaddlePaddle入门与核心实践
  • 使用ZYNQ芯片和LVGL框架实现用户高刷新UI设计系列教程(第四十讲)
  • 热销榜单:2025年高口碑数字人推荐,解决你的选择难题!
  • 应“双碳”考核!安科瑞通信机房能耗监测方案,让PUE管控精准落地
  • 1天净流入10亿!A500ETF南方凭什么成为布局中国核心资产的优选?
  • Android 基础入门教程之RelativeLayout(相对布局)
  • 基于微信小程序的跑腿系统的设计与实现毕业设计项目源码
  • 基于SpringBoot的社区老年人健康知识阅读分享管理系统毕业设计项目源码
  • MySQL迁移达梦数据库,Quartz报错“无效的表或视图名”