当前位置: 首页 > news >正文

YOLOv10模型改进-Backbone改进-第58篇:YOLOv10改进策略【Backbone】| MobileNetV3 Backbone替换

一、本文介绍

本文记录的是利用MobileNetV3作为Backbone改进YOLOv10的特征提取部分。MobileNetV3通过深度可分离卷积和倒残差结构,实现轻量级高效特征提取。

二、MobileNetV3模块介绍

2.1 设计出发点

深度可分离卷积将标准卷积分解为深度卷积和逐点卷积,大幅减少计算量。

2.2 模块结构

MobileNetV3块:

  1. 逐点卷积:升维
  2. 深度卷积:空间特征提取
  3. SE注意力:通道注意力
  4. 逐点卷积:降维

三、MobileNetV3的实现代码

importtorchimporttorch.nnasnnclassInvertedResidual(nn.Module):def__init__(self,c1,c2,k=3,s=1,expand_ratio=6,act=True):super().__init__()c_=c1*expand_ratio self.conv1=nn.Conv2d(c1,c_,1,1,bias=False)self.bn1=nn.BatchNorm2d(c_)self.conv2=nn.Conv2d(c_,c_,k,s,k//2,groups=c_,bias=False)self.bn2=nn.BatchNorm2d(c_)self.se=nn.Sequential(nn.AdaptiveAvgPool2d(1),nn.Conv2d(c_,c1//4,1,bias=False),nn.SiLU(),nn.Conv2d(c1//4,c_,1,bias=False),nn.Sigmoid())self.conv3=nn.Conv2d(c_,c2,1,1,bias=False)self.bn3=nn.BatchNorm2d(c2)self.act=nn.SiLU()ifactisTrueelse(actifisinstance(act,nn.Module)elsenn.Identity())self.shortcut=s==1andc1==c2defforward(self,x):out=self.act(self.bn1(self.conv1(x)))out=self.act(self.bn2(self.conv2(out)))out=out*self.se(out)out=self.bn3(self.conv3(out))returnout+xifself.shortcutelseoutclassMobileNetV3(nn.Module):def__init__(self,c1=3,c2=1024):super().__init__()self.stem=nn.Sequential(nn.Conv2d(c1,16,3,2,1,bias=False),nn.BatchNorm2d(16),nn.SiLU())cfg=[{'k':3,'c':16,'s':1,'e':1},{'k':3,'c':24,'s':2,'e':4},{'k':3,'c':24,'s':1,'e':3},{'k':5,'c':40,'s':2,'e':3},{'k':5,'c':40,'s':1,'e':3},{'k':5,'c':40,'s':1,'e':3},{'k':3,'c':80,'s':2,'e':6},{'k':3,'c':80,'s':1,'e':2.5},{'k':3,'c':80,'s':1,'e':2.3},{'k':3,'c':80,'s':1,'e':2.3},{'k':3,'c':112,'s':1,'e':6},{'k':3,'c':112,'s':1,'e':6},{'k':5,'c':160,'s':2,'e':6},{'k':5,'c':160,'s':1,'e':6},{'k':5,'c':160,'s':1,'e':6},]self.blocks=nn.ModuleList()c=16forlayerincfg:self.blocks.append(InvertedResidual(c,layer['c'],layer['k'],layer['s'],layer['e']))c=layer['c']self.final_conv=nn.Conv2d(c,c2,1,bias=False)defforward(self,x):x=self.stem(x)forblockinself.blocks:x=block(x)x=self.final_conv(x)returnx

四、创新模块

将MobileNetV3作为Backbone集成到YOLOv10中:

# yolov10n_mobilenetv3.yamlbackbone:-[-1,1,MobileNetV3,[3,1024]]-[-1,1,SPPF,[1024,5]]

五、预期结果

模型mAP@0.5mAP@0.5:0.95参数量
YOLOv10n52.3%27.9%2.7M
YOLOv10n-MobileNetV351.5%27.2%1.5M

📌项目环境配置

  • Python:3.8.10+
  • PyTorch:2.0.0+
  • CUDA:11.8+
  • Ultralytics:8.3.13+
http://www.cnnetsun.cn/news/3102668.html

相关文章:

  • GPU加速创意革命:MediaPipe TouchDesigner插件如何突破实时视觉交互的边界
  • AI无监督聚类揭示大脑神经亚型多样性
  • 5分钟掌握演讲时间:PPTTimer 智能倒计时工具完整指南
  • 3步解锁QQ音乐格式限制:QMCFLAC2MP3终极解决方案
  • Web安全实战:12个逻辑漏洞案例与系统化挖掘方法论
  • 上海章动最新调研:厂二代企二代接班遇业绩下滑该怎么有效挽救
  • iOS 生态约束下 AVG Mobile Security 移动端钓鱼防护技术实践研究
  • AMD Ryzen终极性能解锁:SDT调试工具完全指南,小白也能变高手
  • 106、数据库连接池设计:DBUtils、SQLAlchemy pooling、连接泄漏检测
  • GBase 8c DN节点扩容缩容使用解析
  • 计算机毕业设计之基于机器学习的商品评论分析系统设计与实现
  • 上海头部GEO平台选哪家合适?2026技术实测、架构分级与工程选型指南
  • 造纸滚筒平衡机
  • 如何打造你的私人云游戏服务器:Sunshine全平台搭建指南
  • Claude Science 让实验笔记本成为产品,Sciverse 要做的是它背后的科学证据数据层
  • 三步解锁加密数据:WechatDecrypt微信聊天记录解密实战指南
  • AWS Wickr企业级端到端加密通信:架构原理、数据留存与部署实战
  • 猫抓浏览器插件:终极网页资源嗅探与下载指南
  • 金融数学和金融工程哪个好就业?理科生报哪个更值?一篇讲清楚
  • OneNote效率革命:OneMore插件终极指南,让笔记管理提升300%
  • 深度解析UnrealPakViewer:Pak文件分析的3大核心技术实现
  • 2026最新华南地区商城小程序开发公司排名,5款亲测好用且省钱!含零代码SAAS、AI编程、源码定制
  • 为什么Python的多线程总是跑不满CPU?
  • 3大AI图像处理工具,让Krita选区效率提升10倍
  • 7款Unity游戏马赛克移除插件:解锁完整游戏体验的终极指南
  • 终极指南:使用SMU Debug Tool深度调试AMD Ryzen处理器底层参数
  • 收藏!AI时代如何选择值得加入的公司?毕业生必看!
  • vLLM推理服务假死排查-多模态缓存幽灵Key导致死循环
  • 江苏公考培训市场“诸神混战”,谁在裸泳谁在真练兵?
  • 从零开始学Linux(三)