基于深度卷积神经网络的高光谱遥感图像分类

更新时间:2023-05-20 09:41:52 阅读: 评论:0

基于深度卷积神经网络的高光谱遥感图像分类
环球雅思培训学校罗建华;李明奇;郑泽忠;李江
【摘 要】传统的高瀑布图像分类模型只考虑光谱特征信息,忽略了图像空间结构信息在分类中的重要作用.为提高高光谱遥感图像的分类精度,提出一种同时利用高瀑布图像的光谱信息和空间信息的深度卷积神经网络分类模型.通过对低层特征自动分层地学习来提取更加抽象的高层特征,提取的特征具有平移、缩放及其他形式扭曲等高度不变性;基于学习到的深度特征,用logistic回归分类器进行分类训练.高光谱数据实验结果表明,深度卷积神经网络模型能够提高高光谱遥感图像的分类精度,从而验证了深度卷积神经网络进行高瀑布图像分类的可行性和有效性.%The traditional hyperspectral image classification model only considers the spectral feature information,and ignores the important role of image spatial structure information in classification.In order to improve the classification accuracy of hyperspectral remote nsing image,this paper prent a deep learning model utilizing the rich spectral and spatial information in hyperspectral images for land cover classification application.The propod model is able to automatically extract more abstract high-level features from the l
ow-level features for classification.In addition,the network structure is highly invariant to translation,scaling and other forms of distortion.Experiment results show that the deep learning method can provide high performances in hyperspectral image classification applications.The feasibility and effectiveness of the deep convolution neural network for classification of hyperspectral images are verified.
英文字母26个字母表
【期刊名称】天降之物falling down《西华大学学报(自然科学版)》
【年(卷),期】mr怎么读2017(036)004
【总页数】8页(P13-20)
【关键词】高光谱遥感图像;卷积神经网络;特征提取;logistic回归分类器;分类精度;可行性;有效性
【作 者】罗建华;李明奇;郑泽忠;李江
【作者单位】电子科技大学数学科学学院,四川 成都 611731;电子科技大学数学科学学院,
四川 成都 611731;电子科技大学资源与环境学院,四川 成都 611731;老道明大学电子与计算机科学,诺福克 美国 23529
【正文语种】中 文
【中图分类】TP391.41
随着高光谱遥感技术的发展,新的高光谱传感器能够同时采集光谱和空间特征的连续图像。这些图像包含了丰富的地物信息。遥感数据不仅反映了地物的光谱信息,而且包含了地物的几何结构和空间分布信息。地物的类型和发展变化引起遥感图像数据值大小的变化,通过分析遥感图像数据的变化规律,能够有效地对地物的类型进行识别和分类。高光谱遥感图像的准确分类是各领域实际应用的一项重要任务,例如农业[1]、天文[2]、环境科学[3]等领域。
高瀑布图像分类仍然面临着非常大的挑战。波段多、波段间相关性强、空间分辨率高的高瀑布图像很难得到更高的解译精度,容易产生Hughes现象[4],从而很大程度上降低了分类精度。此外,高瀑布图像也容易出现同物异谱,异物同谱的情况。空间分辨率的大大提高
环保英语手抄报
使得高分辨率图像包含了更加丰富的信息。与此同时,在光谱和空间域中,这些详细信息增加了类内变化,减少了类间变化,从而大大降低了解译精度。在传统的分类方法中,例如随机森林[5]、决策树[6]、神经网络[7]、支持向量机[8],它们只考虑了高光谱遥感图像的光谱特征信息,忽视了高瀑布图像的空间信息在分类中的重要作用,损失了高瀑布图像空间结构信息,从而造成分类精度不高;因此,在高光谱遥感图像分类中引入更有效的、鲁棒性更强的光谱空间特征是有必要的[9]。
韩剧幽灵剧情相邻的像素可能属于相同的类,因此空间特征在高光谱遥感图像分类中越来越重要[10]。光谱特征和空间特征的结合可使分类精度提高[11]。为充分利用空间特征,各种提取空间特征的方法被提出,例如Gabor纹理特征[12]、灰度共生矩阵[13]、小波变换特征提取[14]、支持张量机[15]、扩展的形态轮廓[16]等。用这些方法在提取空间特征时需要预先手动设定参数,然而通过参数配置,这些提取的空间特征只能针对特定的目标对象,缺少灵活性,并且形状、纹理、边缘等低级特征变化很大,使得这些方法不可能通过设置经验参数来描述所有类型的对象;因此,如何提取鲁棒性更强的高级特征的问题亟待解决。
近几年,深度学习在图像分类领域中取得的成果越来越多。与传统的手工设置空间特征相
京翰教育比,它能够自动分层地提取空间特征,并在图像分类中表现出更高的有效性和更强的鲁棒性。在遥感分类领域,深度学习显示出巨大的潜力。CHEN等[17]率先提出将栈式自编码(SAE)框架应用到高光谱遥感图像分类中。虽然SAE可以从分层结构中提取深度特征,但是为满足SAE框架的输入要求,需要将输入数据(image patches)处理成一维数据的格式,从而忽略了原始数据包含的空间特征信息。
针对以上问题,本文结合高光谱数据和深度学习的特点,提出一种同时考虑像素光谱信息和空间信息的深度卷积神经网络框架。该框架主要步骤如下:首先利用主成分分析法对高光谱遥感图像进行光谱特征提取,消除特征之间的相关性,并降低特征维数,获得清晰的空间结构;然后利用深度卷积神经网络(deep convolutional neural network, DCNNs)对输入的样本进行空间特征提取;最后通过学习到的高级特征进行logistic回归训练。
DCNNs已被证明在解决图像分类方面是非常成功的[18-20]。DCNNs的研究成果对许多图像数据库,包括MNIST数据库、VORB数据库和CIFART数据集的最佳分类有显著提升。人脸和手写数字等一般图像对象具有明显的局部和全局结构,DCNNs非常善于从图像数据中学习局部和全局结构;因此,简单的局部特征(如边缘和曲线)可以组合成更复杂的特征(如
角和形状),并最终组合成对象。在这种背景下,深度卷积神经网络框架有潜力在更高层提取更抽象和更稳定的特征。
深度卷积网络的核心思想是将稀疏连接、权值共享以及时间或空间池采样这3种结构思想结合起来,从而获得某种程度的位移、尺度、形变的不变性[21-24]。DCNN的这3个特点是其对输入数据在空间(如图像数据)和时间(如时间序列数据)上的扭曲有很强的鲁棒性。通常情况,DCNN采用卷积层与下采样层交替设置,利用卷积层提取的特征进行组合,形成更加抽象的特征,最后形成对图片整个对象的描述。其中:卷积层通过卷积运算,可以使原信号特征增强,并降低噪声;下采样层利用图像局部相关性的原理对图像进行子抽样,可以减少数据处理量的同时又保留有用信息。
1.1 卷积层
在卷积神经网络中,卷积层是一个特征提取层,通过卷积运算,可以使原信号特征增强,并且降低噪声。卷积操作可以用来对图像做边缘检测、锐化、模糊等。其卷积过程可以表示为
式中:Mj 表示输入特征图的一个选择集合;xjl表示第l层中输出特征图j的激活值;kil是第l-1层特征图i和第l层特征图j之间的卷积核;bjl是第l层第j个特征图的偏置值;*表示二维离散卷积运算运算符。
1.2 下采样层
下采样层(subsample)又称为子采样层或者池化层(pooling),它可看作是模糊滤波器,利用图像局部相关性的原理,对图像进行子抽样,起到二次特征提取的作用,既可减少数据处理量又可保留有用信息。常见的采样方法有mean pooling(均值采样)、max pooling(最大池采样)、overlapping (重叠采样)、L2 pooling(均方采样)、local contrast normalization(归一化采样)、stochasticpooling(随即采样)、def-pooling(形变约束采样)。其中最常用的是最大池化采样。卷积神经网络的非线性变换下采样过程可以表示为
线性下采样过程是指该层下采样运算不包含可学习的权值和偏置。它可表示为
其中down()表示下采样函数。下采样层是对上一层特征图的一个采样处理,采样方式是对上一层特征图的相邻小矩形区域进行聚合统计,区域大小为scale×scale,然后取小区域的
topspeed最大值或者平均值。本文采用线性下采样过程。此外,卷积的计算窗口是有重叠的,而下采样的计算窗口没有重叠。
william masters
1.3 全连接层
图像经过下采样后,得到一系列特征图,而多层感知器接受的输入是一个向量。此外,为增强网络的非线性映射能力,同时限制网络规模的大小,需要将这些特征图中的像素依次取出,排列成一个向量,然后接入到一个全连接层。该层的每一个神经元与前一层的所有神经元互相连接,同层神经元之间不连接。其数学表达式为
式中:l表示当前层数;是该层神经元j与前一层神经元i的连接权重;是该层神经元j的偏置;f(·)表示激活函数。
1.4 Softmax回归
Softmax回归是在逻辑回归的基础上推广而来的,是为了解决多分类问题。Softmax回归是监督学习算法,它可以与深度学习或无监督学习方法结合使用。卷积神经网络的最后一层通常采用非线性分类能力强的Softmax回归作为分类器。其中,logistic回归分类器的输入
维度与DCNN的最后一层输出维度相同,它的输出维度与所分类别梳理一致。
假定可分为k类的m个样本组成训练集{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m)),样本x(i)∈Rn+1,类别y(i)∈{1,2,…,k},n是样本维数。对于给定的训练样本x,假设函数对每一个类别j估算出概率值p(y=j|x),也就是估计样本x被划归为每一种分类结果的可能概率。假设hθ(x(i))函数可表示为
其中,θ1,θ2,…,θk属于模型的参数,等式右边的系数是对概率分布进行归一化,使得总概率之和为1。得到新的代价函数为
其中,是权重衰减项,λ是权重衰减系数。这样代价函数就是凸函数,在优化过程可防止陷入局部收敛,从而得到最优解。
1.5 激活函数ReLU
在神经网络中,非线性函数作为神经元的激活函数。常用的激活函数包括Sigmoid函数和双曲正切函数。Sigmoid函数和双曲正切函数是饱和的非线性函数(saturating nonlinearities)[21],即它们的梯度容易饱和。当输入非常大或非常小时,函数激活值接近
于0或者1,函数的梯度接近于0。在反向传播计算梯度过程中,每层残差接近于0,计算出的梯度也不可避免地接近于0。这样在参数调整过程中,会引起参数弥散问题,传到前几层的梯度已经非常靠近0,参数几乎不会再更新。
>end up

本文发布于:2023-05-20 09:41:52,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/115648.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:图像   特征   分类   卷积   光谱   采样   空间
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图