来源:公众号“遥感与深度学习“原文链接:https://mp.weixin.qq.com/s/ApvUzzfX1Nt1j6S6iLPxeA?scene=1&click_id=32
题目:Partial Weakly-Supervised Oriented Object Detection
会议:The IEEE/CVF Conference on Computer Vision and Pattern Recognition 2026
论文: https://arxiv.org/abs/2507.02751
数据: DOTA-v1.0/v1.5/v2.0, DIOR
代码: https://github.com/VisionXLab/PWOOD
年份: 2026
单位: 上海交通大学、武汉大学、华东师范大学、中国科学院空天信息创新研究院、东南大学
CVPR2026 遥感AI方向合集:CVPR2026
团队系统性成果
创新点
- 提出首个基于部分弱标注(水平框或单点)的有向目标检测框架PWOOD,实现低成本高性能检测
- 设计方向与尺度感知学生模型(OS-Student),使学生模型能从弱标注中学习方向与尺度信息
- 提出类别无关伪标签过滤策略(CPF),基于高斯混合模型动态调整过滤阈值,降低对静态阈值的敏感性
- 支持多格式标注(RBox、HBox、Point)的联合训练,进一步提升框架的通用性与灵活性
背景
有向目标检测(OOD)在遥感等领域需求旺盛,但旋转边界框(RBox)标注成本极高,制约了大规模数据集的构建。现有方法主要分为三类:基于完整RBox标注的全监督方法、基于部分RBox标注的半监督方法、以及基于水平框或点标注的弱监督方法,三者均在标注速度或标注成本上存在较大负担。
为此,本文提出了一种新范式——部分弱监督有向目标检测(PWOOD),仅使用少量水平框或单点弱标注数据,并充分利用大量无标注数据进行训练,在大幅降低标注成本的同时,实现与半监督方法相当甚至更优的检测性能。

数据
DOTA数据集(三个版本)
- DOTA-v1.0包含15个类别、188,282个实例;v1.5和v2.0进一步增加了大量小目标标注
- 从训练集中随机采样10%、20%、30%的图像作为弱标注数据,其余图像作为无标注数据
- 弱标注数据在加载时去除方向与尺度信息,模拟真实弱标注场景
DIOR数据集
- 共23,463张图像,其中11,725张用于训练,11,738张用于测试
- 同样离线划分出10%、20%、30%子集作为有监督数据,其余作为无监督数据
方法
PWOOD整体框架
基于教师-学生范式构建,教师模型对无标注数据生成伪标签,学生模型同时从弱标注数据和伪标签中学习,并通过指数移动平均(EMA)反向更新教师模型权重,形成正向反馈循环。

方向与尺度感知学生模型(OS-Student)
- 对输入图像进行垂直翻转或随机旋转,生成变换视图,构建弱监督对与自监督对
- 通过角度损失约束学生模型从水平框标注中学习目标方向信息
- 引入Bhattacharyya系数衡量预测框之间的高斯分布重叠,作为尺度上界约束
- 利用Voronoi图与分水岭算法估计每个目标的盆地区域,作为尺度下界约束
- 结合高斯Wasserstein距离损失监督宽高回归
类别无关伪标签过滤(CPF)
- 将教师模型输出的伪框置信度分数建模为正负样本两个一维高斯分布的混合模型
- 使用期望最大化(EM)算法推断后验概率,动态确定过滤阈值
- 相较于静态阈值策略,CPF能自适应地适配不同训练阶段和数据分布,提升伪标签质量
结果与分析
PWOOD在DOTA和DIOR多个数据集上,仅使用水平框或单点弱标注,即可达到与基于完整旋转框的半监督基线相当甚至更优的检测性能。此外,PWOOD在噪声鲁棒性和复杂小目标场景下均优于现有弱监督方法,验证了其高效性与通用性。




