当前位置: 首页 > news >正文

(cvpr26) F2Net: A Frequency-Fused Network for Ultra-High Resolution Remote Sensing Segmentation

1、研究动机

论文主要解决超高分辨率(UHR)遥感图像语义分割问题,现有方法采用多分支架构(如 GLNet、ISDNet)以同时保留局部细节与全局语义,但这类方法存在两个问题:

一是分支内部计算效率低(如反复裁块推理),二是多分支并行训练引发梯度竞争,导致收敛不稳定与特征对齐困难。

该论文从频率域视角出发,通过将图像分解为高低频分量并为各分量设计专属分支,同时引入专用损失函数,解决上述问题。

2、模型框架

模型整体框架如下图所示,首先将UHR 图像动态分解为高频分量与低频分量,高频分量使用 Mamba 提取特征,低频分量又分为 短程依赖子分支(局部语义)与长程依赖子分支(全局上下文)分别处理。后面再用频率融合模块和两个辅助损失把三路信息对齐、稳定训练。

总体为三分支结构:

  • 高频分支,采用基于状态空间模型(VMamba)的多阶段编码器提取层次化表示
  • 短程子分支,基于 CNN 骨干网络建模局部语义特征
  • 长程子分支,基于轻量级VIT建模长程全局依赖

(1)Adaptive Frequency Decomposition:论文设计了自适应频率分解,可以根据输入遥感图像自身纹理、边缘、内容复杂度,动态将原图拆分为 高频特征分量 + 低频特征分量。具体流程为:1、将通道划分成多个 group。2、每个 group 根据自身内容生成一个低通滤波器。3、用低通滤波器提取低频信息。4、高频滤波器通过 “恒等滤波器减去低频滤波器” 得到。

(2)Hybrid-Frequency Fusion:第一步:对于输入的FsF_sFsFlF_lFl特征,首先计算通道维度的 attentionAs∈RCsA_s\in\mathbb{R}^{C_s}AsRCsAl∈RClA_l\in\mathbb{R}^{C_l}AlRCl,计算特征通道关系:M=σ(AsAlT)∈RCs×ClM=\sigma\left(A_{s} A_{l}^{T}\right) \in \mathbb{R}^{C_{s} ×C_{l}}M=σ(AsAlT)RCs×Cl,该矩阵刻画了输入特征不同通道间的全局关联。第二步:引入两个独立 MLP 对MMM做维度匹配,再分别与矩阵 A相加,得到精细化注意力权重A~s、A~l\tilde{A}_s、\tilde{A}_lA~sA~l。再用 1×1 卷积统一两个分支的通道维度,加权相加得到融合特征。

(3)Cross-Frequency Alignment Loss:强制高低频分支在语义层面保持一致,消除频率带来的表征偏差。使用 KL 散度来实现约束。

(4)Cross-Frequency Balance Loss:各分支的梯度大小差距很大,如果某条分支梯度大,则参数更新快、网络过度偏向这条分支学习。容易变成单分支主导,其他分支失效,模型整体性能下降。CFBL 就是主动约束所有分支的梯度大小,让每条分支的学习力度保持均衡。

http://www.cnnetsun.cn/news/2925208.html

相关文章:

  • 三分钟掌握Real-ESRGAN-GUI:让模糊图片瞬间变清晰的终极指南
  • Ubuntu新手避坑:arm-linux-gcc命令找不到?可能是你装错了架构(附交叉编译工具链安装指南)
  • linux命令:lsof、uniq
  • 终极SillyTavern角色卡片实战指南:从零打造生动AI伙伴的完整教程
  • 告别追番困扰:Animeko跨平台弹幕播放器的三大核心价值
  • 别再问FAB厂转IC难不难了!手把手教你评估自身条件与制定学习路线(数字验证/版图方向)
  • 指纹浏览器代理中台设计:为每个指纹环境绑定独立出口IP的架构实现
  • 独立开发者必备:5 个能直接赚钱的全栈小产品 Prompt
  • 终极指南:如何构建高效的微信好友安全检测系统 - 从传统协议模拟到Hook技术的完整演进
  • 法考报名流程|报名入口|资料已整理
  • 如何快速掌握Dify工作流:新手友好的完整AI自动化指南
  • 为什么大厂都在用Elasticsearch?我部署一次后终于明白了
  • Browser Use 安装、使用方法详细全解
  • create_agent:LangChain 新版 Agent 的核心入口
  • HSTracker终极指南:macOS炉石传说智能卡组追踪器完全教程
  • MPC8260 MCCs:嵌入式通信硬件加速与SS7协议处理实战解析
  • Cursor AI Pro解锁工具完整指南:3分钟免费获取AI编程助手高级功能
  • 从ACE到ASIO再到libevent:一个老C++程序员的技术栈变迁与选型思考
  • 深入解析MPC7450:PowerPC寄存器模型与指令集实战指南
  • GiliSoft Exe Lock(exe程序加密软件)
  • 鸿蒙 PC应用集成 hwloc:3 大 NAPI 编译坑详解
  • 终极DayZ单机体验:3步解锁免费离线生存模式
  • 如何用AI魔法让模糊图像重获新生:Real-ESRGAN-GUI图像修复实战
  • Pandas数据清洗六大实战Hack:性能优化与工程化实践
  • 买到了冒牌货的内存条----山寨内存条-----------是正规的
  • [Android] 软眠眠-治愈系白噪音睡眠监测助眠工具
  • 计算机Java毕设实战-基于 SpringBoot 的水果库存与购物管理系统的设计与实现 现代化生鲜水果电商信息化管理系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】
  • Rust借用检查器深度剖析:从NLL到生命周期省略规则的编译器逻辑
  • Java毕业设计-基于 SpringBoot+Vue 前后端分离的足球俱乐部管理系统的设计与实现 面向足球俱乐部运营的信息化管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)
  • Java毕业设计-基于 SpringBoot+Vue 前后端分离的校园信息共享平台的设计与实现 前后端分离架构下校园资讯共享管理系统(源码+LW+部署文档+全bao+远程调试+代码讲解等)