基于旋转不变卷积神经网络的高分辨率光学遥感图像目标检测

doi:10.15978/j.cnki.1673-5668.202006012

基于旋转不变卷积神经网络的高分辨率光学遥感图像目标检测

程塨, 周培诚, 韩军伟^,^*

西北工业大学自动化学院西安 710072

通讯作者: *E-mail: jhan@nwpu.edu.cn

Online: 2020-12-15

作者简介 About authors

程塨,西北工业大学研究员,博士生导师,科睿唯安全球“高被引科学家”。以第一作者/通讯作者发表论文30余篇,包括Proceedings of the IEEE、IEEE TPAMI、IEEE TIP、IEEE TGRS、CVPR、IJCAI等,10余篇论文入选ESI高被引论文/热点论文,2篇论文入选2018中国百篇最具影响国际学术论文;担任IEEE GRSM、IEEE JMASS、IEEE JSTARS、ISPRS JPRS、JRS等多个国际期刊的编委。主要研究方向为深度学习、高分辨率遥感图像理解等。

PDF (2435KB) 元数据多维度评价相关文章导出 EndNote| Ris| Bibtex 收藏本文推荐给朋友

本文引用格式

程塨, 周培诚, 韩军伟. 基于旋转不变卷积神经网络的高分辨率光学遥感图像目标检测[J]. 科学观察, 2020, 15(6): 75-76 doi:10.15978/j.cnki.1673-5668.202006012

随着卫星和航拍遥感图像数据的爆炸式增长,迫切需要遥感大数据自动分析技术。高分辨率光学遥感图像目标检测是海量遥感图像数据智能解译的关键技术,在搜救、侦察、监视、预警等军民领域具有重要的应用价值。

传统的图像识别算法主要依赖于人工对图像特征的提取和描述（如颜色特征、纹理特征、形状特征等）,导致图像识别问题进展缓慢。近年来,随着大规模标注数据、高性能的硬件计算资源和先进的机器学习算法的出现,深度学习技术尤其是卷积神经网络（Convolutional Neural Networks, CNNs）在自然图像识别领域取得了里程碑式的进展。

众所周知,与自然图像相比,高分辨率遥感图像是基于卫星、飞机、飞艇等成像平台获取,采用俯视成像,使得遥感图像中的目标具有各种各样不同的朝向。此外,遥感图像具有成像场景大、尺度效应明显、观测角度差异大、空间位置特征突出等特点。这些综合因素使得高分辨率遥感图像识别与自然图像理解相比,面临着更大的挑战和更多的难点问题。虽说深度学习技术在自然图像识别任务上有了突破性进展,但是,由于存在遥感成像视角的特殊性、地面目标的繁杂性、地表信息的丰富性,致使深度学习技术直接应用于遥感图像目标检测面临着目标方向多变、样本多样等严峻挑战。所以,如何实现不变性特征的学习和提取是遥感图像目标检测面临的巨大挑战。

主流的深度学习模型尤其是卷积神经网络虽具有一定的特征不变性（如平移不变性、尺度不变性等）,但它们的设计并没有专门考虑旋转不变性,只是通过最大池化稍微补偿一下这个功能。而旋转不变特征是解决遥感图像目标方向多变这一问题的根本途径,这就造成传统的卷积神经网络模型很难实现遥感图像的鲁棒目标检测。在深度学习框架下,如何通过设计合适的网络结构和目标函数实现旋转不变深度特征提取是一个迫切需要解决的问题。

我们针对这一挑战开展创新突破,取得了一系列工作。首先,我们以卷积神经网络为深度学习模型,在常规卷积神经网络目标函数的基础上,设计了旋转不变层并引入旋转不变正则项约束来构建旋转不变卷积神经网络（Rotation-Invariant Convolutional Neural Networks, RICNN）,如图1所示,实现了旋转不变CNN特征的提取（IEEE Trans. Geosci. Remote Sens., 2016, 7405-7415; IEEE CVPR, 2016, 2884-2893）。这个工作是该领域第一次明确提出旋转不变卷积神经网络的解决思路。此外,为了降低运算量并进一步提高目标检测精度,我们提出了旋转不变判别的卷积神经网络（Rotation-Invariant and Fisher Discriminative Convolutional Neural Networks, RIFD-CNN）,如图2所示,通过设计旋转不变正则项和费舍尔判别正则项约束,借助多任务学习协同优化策略,在Faster R-CNN、R-FCN等多个通用的深度学习目标检测框架上实现了旋转不变判别特征提取（IEEE Trans. Image Process., 2019, 265-278）。

图1

新窗口打开| 下载原图ZIP| 生成PPT

图1 旋转不变卷积神经网络

图2

新窗口打开| 下载原图ZIP| 生成PPT

图2 旋转不变判别卷积神经网络

我们提出的这一系列方法简单有效、易于实施,获得了同行的高度关注和认可。如美国工程院院士R. Calderbank教授与美国文理科学院院士G. Sapiro教授等合作发表在机器学习领域顶级会议ICLR 2019的论文“RotDCF: decomposition of convolutional filters for rotation-equivariant deep networks”,用我们的旋转不变卷积神经网络作为例证,指出尽管CNNs被广泛应用于计算机视觉和图像处理,但是传统CNN网络本身的设计并不能有效处理旋转不变性,在许多任务上降低了CNN的性能;美国工程院院士B. R Scanlon教授评价我们的工作为“旋转不变卷积神经网络的范例工作（example article）”。由中国科学院文献情报中心“世界科学前沿发展态势分析”课题组通过Web of Science数据库进行的文献计量学统计结果显示,我们提出的RICNN工作（IEEE Trans. Geosci. Remote Sens., 2016, 7405-7415）位居2015–2019年地学领域研究论文中获得引用数最多的中国学者论文排名的第4名。

我们的研究成果成功应用于某型高分辨率遥感对地观测系统和某战区大型军事活动等,实现了高效的态势感知和威胁估计,取得了显著的社会效益和经济效益。

未来的研究工作中,我们拟将旋转不变卷积神经网络的学习与深度学习模型的可解释性相结合,发展并建立可解释的神经网络模型,进一步打破深度学习在遥感图像理解上的发展瓶颈,实现遥感大数据知识表达的可视化、结构化和语义化,显著提高遥感图像的利用率和智能化处理水平。

观宇宙之博大察万物之精微