当前位置: 首页 > news >正文

【计算机科学与应用】基于Mask R-CNN的近海漂浮垃圾智能识别与清理路径规划系统

导读:

针对近海漂浮垃圾人工清理效率低、成本高和风险大的问题,本文设计了一套基于Mask R-CNN的智能检测与清理路径规划系统。系统采用Roboflow海洋垃圾数据集,包含11类目标、10,000张图像和56,272个标注实例;基于ResNet-50-FPN的Mask R-CNN实现目标检测与实例区域分割,并将清理路径建模为非闭合旅行商问题,采用最近邻贪心算法与2-opt局部搜索进行优化。实验结果表明,模型在验证集上的边界框AP为53.50%,掩码AP为 52.05%;路径规划算法在200个目标规模下耗时约181.8 ms,路径长度缩短约10.5%。同时,本文开发了Web与桌面双模态可视化系统,实现了图像输入、目标检测、路径规划和结果展示的原型化闭环流程,为近海漂浮垃圾智能识别与自动化清理提供了实验基础。

作者信息:

Mask R-CNN;海洋垃圾检测;实例分割;路径规划;深度学习

论文详情

本文开发的近海漂浮垃圾智能识别系统采用分层模块化架构,自下而上分为数据采集层、模型推理 层、路径规划层和可视化展示层四个层次,各层之间通过定义良好的接口进行通信,系统总体架构如图 1 所示。

算法处理流程如图 2 所示。

本文基于该数据集,经筛选合并,确定 11 类检测目标(见表 1),兼顾了材质性和功能性两个维度。

数据集按 7:2:1 划分(见表 2)。

本文采用 Mask R-CNN作为基础检测框架,具体实现基于 Detectron2 框架。模型以 ResNet50为骨干网络提取图像特征,结合特征金字塔网络(FPN)构建多尺度特征表示。

采用最近邻贪心算法构建初始可行解(Algorithm 1),时间复杂度 O(N2 )。

为说明选择 Mask R-CNN 作为检测模型的理由,本文将 Mask R-CNN 与当前主流目标检测算法进行对比分析,结果如表 3 所示。

为进一步定量比较不同模型的检测性能,本文在相同数据集和训练设置下分别训练 Faster R-CNN 与 Mask R-CNN 模型,并在验证集上使用 COCO 评估标准进行评测,结果如表 4 所示。

Mask R-CNN 模型共迭代 18,000 次。训练过程中损失函数和正确率的变化曲线如图 3 所示。

从表 10 可以得出:(1) 计算效率高——200 目标下总耗时(贪心初始化 + 2-opt 优化)约 181.8 ms,其 中 2-opt 优化阶段耗时约 99.5 ms;(2) 2-opt 效果显著——改善率随目标数量增大,在 N = 100 时达到饱和 约 10.5%;(3) 路径长度呈亚线性增长,算法在大规模场景下保持良好规划质量;(4) 后续工作需在更多 随机初始条件下进行统计测试,以进一步验证算法的稳定性。

路径规划算法的性能对比结果如图 5 所示。

本文针对近海漂浮垃圾清理的实际需求,设计并实现了一套基于 Mask R-CNN 的智能检测与清理路 径规划系统。该系统通过数据采集层、模型推理层、路径规划层和可视化展示层的分层架构,实现了从 图像输入、自动检测到路径规划的全流程智能化闭环。系统提供了 Web 端和桌面端双模态交互界面,在 GPU 环境下端到端处理时间不超过 5 秒,能够完成静态图像条件下的垃圾目标检测、实例区域分割和路 径规划结果展示,为后续面向真实水域场景的动态感知与清理系统开发提供了原型基础。

基金项目:

上海海事大学 2025 市级大学生创新创业训练计划项目(项目编号:S20250605)

原文链接:

https://doi.org/10.12677/csa.2026.166234

http://www.cnnetsun.cn/news/3098290.html

相关文章:

  • 拙见科技(陕西)GEO——Graph RAG 深度解析:从向量检索到知识推理的技术演进
  • Nutstore Sync 和 WebDAV 有什么区别?Obsidian 坚果云同步新旧方案对比
  • 工业色浆施工工艺全流程详解:从调色到涂装的标准化操作指南
  • linux 安装达梦数据库
  • QCMA:基于Qt框架的PS Vita跨平台内容管理技术解析与实现
  • CPT Markets:从外汇行业合规表达切入的逻辑复盘
  • 做自有猫砂品牌怎么选 OEM 代工工厂?采购避坑指南
  • 2026年口碑好的发稿服务商,选这5家不踩坑
  • Nuke Survival Toolkit:150个专业插件让你的合成效率提升300%
  • 如何用Resynthesizer插件实现专业级图像修复与纹理合成:GIMP用户的终极指南
  • Java实现ECC密钥对生成:secp256k1与secp256r1完整指南
  • AI 时代大龄程序员的优势凸显:从技术执行者到系统编排者的历史性跃迁
  • AI Agent:智能体如何重塑我们的数字生活
  • 亦唐科技在人工智能领域的创新与应用:引领智能化时代的变革
  • yansongda/pay分布式支付架构深度解析:多平台安全集成实现原理
  • 第07篇:GPT / LLaMA 架构演进——从 GPT-1 到 LLaMA-3 的“黄金三角“
  • 083、DCNv3 在 YOLOv11 中的适配代码:分组可变形加多尺度机制的联合改进
  • OpenCore Legacy Patcher终极指南:4步解决老Mac显卡驱动与系统升级兼容性问题
  • VSCode扩展生态实战:Task与AI编程工具协同的5类高频插件组合
  • AI获客培训常见误区:从风口焦虑到长期运营
  • C++移动语义开发实践
  • C++线程同步实践指南
  • .数据库内核开发入门:从B+树到MVCC与SQL执行引擎的实现路径
  • C++内存池设计实践
  • CQRS模式在电商系统应用
  • 凋亡金标准直观验证!细胞凋亡 DNA Ladder 抽提试剂盒
  • 从研发效率看业务系统嵌入数据分析能力:如何避免一个功能变成数据工程
  • 深度共识:AI时代的四种人类姿态
  • AI 电动刨冰机智能功率 MOSFET 核心驱动方案
  • 小米穿戴表盘设计终极指南:无需代码打造个性化智能表盘