当前位置：首页 > news >正文

【山东工商大学-AAAI26】整合方向、频率 - 空间和结构注意力用于医学图像分割

news 2026/6/3 19:02:37

文章：Decoding with Structured Awareness: Integrating Directional, Frequency-Spatial, and Structural Attention for Medical Image Segmentation

代码：暂无

单位：山东工商大学

医学影像分割是智能医疗的核心技术之一，它能自动从复杂影像中分离出器官、肿瘤或病变区域，为诊断、手术规划、放疗设计提供关键参考。但现有主流技术（比如Transformer模型）存在明显短板：

传统的CNN模型（如U-Net）虽擅长提取局部特征，但抓不住全局结构；Vision Transformer能捕捉长距离关联，却对细节不够敏感。这些问题让AI分割的精度难以满足临床需求。

研究者设计了一款全新的解码器框架，通过三个核心模块的协同工作，同时解决细节捕捉、全局建模和特征融合三大问题：

就像给AI装上“方向探测器”，专门关注图像的平面、水平、垂直三个方向。它能自动学习关键区域的结构 orientations，比如肿瘤的长轴方向、器官的边缘走向，让AI对细微结构的敏感度大幅提升，不会错过重要细节。

这个模块堪称AI的“全能分析员”，同时从三个维度解析图像：

空间维度：直接观察图像的直观形态；
频率维度：捕捉整体结构和长距离关联；
小波维度：用DoG、Mexican Hat两种经典算法，放大细微纹理和边缘。通过智能融合三个维度的信息，既避免了“只见树木不见森林”，也不会因关注全局而忽略局部细节。

传统AI的特征融合像“简单拼接”，容易混入无用信息。这个模块就像“智能过滤器”，先筛选出编码器和解码器中最有价值的特征，再通过多尺度卷积扩大感知范围，最后聚焦于高优先级区域，让融合后的特征更纯粹、边界更清晰。

研究者在皮肤病变、腹部多器官、心脏结构三大类医学影像数据集上做了严格测试，结果令人惊艳：

Synapse腹部多器官数据集：平均分割准确率（DSC）达83.92%，超越EMCAD、AD-LA Former等主流模型，其中脾脏、左右肾脏的分割精度排名第一；
ISIC 2017皮肤病变数据集：DSC高达91.40%，准确率（ACC）97.26%，在敏感率和特异度上实现完美平衡；
ISIC 2018皮肤病变数据集：以90.71%的DSC和96.62%的ACC拿下双第一，敏感率（SE）93.34%仅次于一款专用模型；
ACDC心脏数据集：平均DSC 92.75%，左心室分割精度达96.67%，远超Swin-UNet、TransUNet等经典模型。

可视化结果显示，新方案分割的边界更平滑、结构更完整，即使是模糊病灶也能精准勾勒。