第39卷第3期 2021年5月
吉林大学学报(信息科学版)
Journal of Jilin University ( Information S c i e n c e Edition)
Vol. 39N o. 3
M a y 2021
文章编号:1671-5896(2021)03-0331~08
面向水下多源数据特征级融合方法
宋奎勇U2,周连科\王红滨1
(1.哈尔滨工程大学计算机科学与技术学院,哈尔滨15_;2.呼伦贝尔职业技术学院信息工程系,内蒙占呼伦贝尔021000)
摘要:海洋环境复杂多变,单一水下传感器目标识别精度不能满足系统性能要求,并且水下数据噪声大、维度
高,直接进行数据融合并不能得到较好的结果。为此,针对多场景水下多源试验数据,使用去噪自编码和多种
降维方法进行多角度特征级融合。首先,使用去噪自编码器去除噪声、降低数据维度并且抽取出深层特征;
然后,对深层特征使用数据层叠方法进行多源数据融合。融合方法包括主成分分析、独立分量分析和等度量映
射=不同场景下对比试验表明该方法取得较好的分类结果,其中主成分分析取得较高目标识别率
关键词:水下多源数据;特征级融合;去噪自编码;降维方法;数据层叠方法
中图分类号:T P389. 1文献标识码:A
Feature-Level Fusion Method for Underwater Multisource Data句子成分ppt
SONG Kuiyong12, ZHOU Lianke1 , WANG Hongbin1
(1. College of Computer Science and Technology, Harbin Engineering University,Harbin 150000,China;
2. Department of Information Engineering, Hulunbuir Vocational Technical College, HulunBuir 021000, China)
Abstract:The marine environment is complex and changeable, and the target recognition accuracy of a single underwater nsor can not meet the performance requirements of the system. Multi-source nsor fusion is an effective method that can improve the target recognition rate. It has received extensive attention and rearch. Underwater data is noisy and has high dimensions, and direct data fusion can not get better results. For multi- scene underwater multi-source test data, denoising autoencoder and multiple dimensionality reduction methods is ud for multi-angle feature-level fusion. First, the denoising autoencoder is ud to remove noi and reduce the data dimension,and extract new features from the source data. Then,the data cascade method is ud for multisource data fusion for new features. The fusion methods include principal component analysis, independent component analysis and isometric mapping. Comparative experiment results in different scenarios show that the propod method gets better classification results, and principal component analysis can achieve a higher target recognition rate.
Key words:underwater multisource data;feature-level fusion;denoising autoencoder;dimensionality reduction method ;data stacking method
〇引言
海洋环境复杂多变,水下目标识别困难重重。近年来,海上船舶数量越来越多,频繁活动带来的背 景噪声增加了目标识别的任务难度,单一传感器在这种环境下显得力不从心,精度不高。多源传感器融
收稿日期:2020~08-31
基金项目:国家自然科学基金资助项目(61772152);国家重点研发计划基金资助项目(2018YFC0806800);技术基础科研基金资助项 目(JSQB2017206C002);中国博士后科学基金资助项目(2019M651262);教育部人文社科研究青年基金资助项目
(20Y jC Z H172);黑龙江省博士后基金会基金资助项目(LBH-Z丨9015)
作者简介:宋奎勇(1979— ),男,内蒙古赤峰人,哈尔滨工程大学副教授,主要从事信息融合、深度学习研究,(1^1)86-177****9546(E-mail)*********************=
332 吉林大学学报(信息科学版) 第39卷合是一种有效提高识别精度的方法,得到广泛的研究并取得很好的效果。水下传感器融合是当前目标识 别研究的热点和难点>3]。
信息融合可定义为利用计算机技术对按时序获得的若干传感器的观测信息,在一定准则下加以自动 分
析、综合以完成所需要的决策和估计任务而进行的信息处理过程。数据融合可分为像素级融合、特征 级融合和决策级融合14~。像素级融合指在原始数据上进行融合,对原始数据未作任何处理。特征级融 合首先对传感器原始信息进行特征提取,然后对其进行综合分析和处理。一些经典的特征融合方法包括 主成分分析(PC A : P r i n c i p a l C o m p o n e n t A n a l y s i s )、线性判别分析(LD A : L i n e a r D i s c r i m i n a n t A n a l y s i s )、等 度量映射(ISOMAP : I s o m e t r i c M a p p i n g )和局部线性嵌人(LLE : L i n e a r L o c a l l y E m b e d d i n g )等[7]。近年来, 自编码器(AE : A u t o e n c o d e r )作为一种非线性特征融合方法被广泛关注,许多自编码器模型被提出+9], 如基本自编码器(BAE : B a s i c AE )、去噪自编码器(DAE : DenosingAE )、压缩自编码器(CAE : C o n t r a c t i v e AE )和强壮自编码器(RAE : RobustAE )等。自编码器被广泛应用于特征级数据融合
针对水下试验数据噪声大、维数高的特点,笔者提出一种结合去噪自编码和降维的多角度特征级融 合方法。首先,使用D A E 降低数据噪声、提取数据特征同时对数据降维;然后,对新特征采用层叠式融 合策略进行特征融合,使用的融合方法包括主成分分析、独立分量分析和等度量映射。笔者方法在水下 多源试验数据上取得较好的目标识别率。
1背景知识
自编码是一种对称结构神经网络模型,图1所示为一个3层的自编码,包括输入层、隐藏层和 输出层。隐藏层是对输入数据的重新编码,而输出层是对隐藏层的重构。如果隐藏层小于输入层、
输出层神经元个数,则隐藏层数据是对原始数据的
《假如给我三天光明》读后感降维表示。图I 是包含1个隐藏层的自编码,通过
两个权重矩阵w (1)、w (2)和两个偏置向量、f t (2)
设定为
y = f (x) =
+ b n ) (1)2 = g(y) = s2(w 2]f (x) + b 2>) (2)其中h
为激活函数,一般使用非线性函数,/为 编码函数,g 为解码函数。自编码器使用目标函数
F i g . 1 3-l a y e r a u t o e n c o d e r s t r u c t u r e d i a g r a m 优化)v 和s 使重构误差最小。最具代表性的目标函数有均方误差函数和交叉熵函数。均方误差函数为/M S E (x ,2) = I I *-2 ||〖,交叉熵的函数为
d
lC K (x,z) =- ^%t l o g z t + (l -A :t )l o g (l - zk) (3)
k = l 2 D A E 结合P C A 特征融合
海洋环境水声数据噪声大、维数高,去噪自编码器D A E 能减少环境背景噪声的影响,并能学习到水 声数据深层特征。笔者提出的一种多角度特征融合方法处理水下数据如图2所示,图2左侧是使用DAE
去除噪声、降低维数,并抽取出深层特征;图2右侧使用PCA 融合方法对多源水下数据融合,并对融合 后的数据分类,比较不同融合方法的分类效果。
2.1去嗓自编码特征融合
DAE [I 2]能使用被损坏的数据作为输人重构源数据,即D AE 对损坏的数据能建立潜在的特征空间,对损 坏数据更具有鲁棒性。DAE 结构和参数与普通自编码器相似,区别在于输人数据在训练阶段使用了损坏的 数据,并且在训练阶段随机选择一定数量节点设置为〇。笔者方法中DAE 使用的最小化目标函数为
德国电话
d
h>.\z(x,z) =- ^ A :A .l 〇g + (1 -^)l o g (l - zk) (4)
A = 1其中
图1 3层自编
码结构图
第3期宋奎勇,等:面向水下多源数据特征级融合方法333
^ = g(y) = s 2(^'2)f (x ) + b [2))
(5)J - f (x ) = 5i (w ^(I )a ; + b i[))
(6)i = a : + N (0,(t 2I ) (7)
关爱老人的作文
X 为源数据,X 为添加高斯噪声输入,^为噪声程度,i 为重构数据。由文献[10]可知,3层D A E 是简单、 效果好的架构,使用此架构隐藏层数据,即为D A E 处理后的深度特征表示。
内蒙古招生考试网
输入层隐藏层输出层
>-<
图2 结合DAE 和PCA 特征融合结构图
Fig. 2 Combination of DAE and PCA feature fusion structure diagram
2.2 PCA 层叠式特征融合
PCA 11W 4]是一种经典数据降维算法,对降噪也有很好的效果。P CA 的主要思想是将;V 维数据投影到 维度为/C 的子空间中(X < A 〇,K 值可以指定或利用主成分信息确定。优化目标是选择个单位正交基, 使原始数据变换到这组基上后,各变量两两间协方差为〇,而变量方差则尽可能的大。对PCA 算法,要 点是如何找到满足条件的尺个单位正交基。若有训练样本集尤=岁",尤(2),…,X (m),可计算如下协方差 矩阵
当均值M =0时,
C = ~X X T = m "cov(^, ,x x) COv( jt :2 )cov(^, ,x2)
co\(x2 ,x 2)
co \{xm ,x x )cow{xx ,xm )- cov(x2,xm )撕(〜人)」
c o v (a ;. ,%•)=丄 2>,-w 2爪fr!
(8)(9)c o v (x i 9Xj ) = —Y ^x ixi
m . _ I (10)在此矩阵中,主对角线为方差,其余部分为协方差,若把此矩阵对角化,则正好满足方差尽可能大, 而协方差为0,并且在主对角线上元素按大小从上到下排列,达到优化目的。若P 是按行组成的一组基, 设y =/^,y 为到故基变换后的数据,;K 的协方差矩阵为D ,则有
D YY'l (P X )(P X )T =l /^〇r T P l '=i P (-l -J 〇:T ')/)T =i PCPT m m \ m /(i i )未闻花名壁纸
其中〇为对角矩阵,且£>是对C 的对角化。可利用特征值分解或奇异值分解求矩阵C 的特征值和特征 向量。选择最大的A 个特征值,其对应的特征向量P 就是所求的K 维子空间,将数据投影到;c 维子空间 中,即y = y 就是d 降维后的特征表示。
将多源水声传感器对同一目标进行同步侦测,所得传感器数据相互间有一定线性关系,而PCA 是一 种线性降维方法,所以使用P CA 是适合的。如图3所示,为了得到更准确的分类效果,使用了层叠式 PCA 融合方法,第i 、i + l 、i +2 3组数据融合为1组,i + U +2、i +3 3组数据融合为1组,以此类推。层
叠式融合方法会使同类数据更加相似。
声现象测试题
334吉林大学学报(信息科学版)第39卷
2m 船尾至水听阵16.8 m 图3 PCA 层叠式特征融合结构图
F i g . 3 PCA s t a c k e d f e a t u r e f u s i o n s t n j c t u r e d i a g r a m
经过D A E 和PCA 融合后的数据,维数更小、特征更突出。若将多传感器数据比作二维表,则DAE 从横向上压缩并抽取特征数据,PCA 从纵向上融合数据。因此数据在进行分类时,时间效率更高,分类 精度会更好。
2.3算法基本步骤
在不同环境下采集水下数据,使用笔者算法融合处理,基本步骤如下:
步骤1多源水下传感器数据采集;
步骤2数据分段、标准化处理;
步骤3使用D A E 对数据进行特征融合;
步骤4使用PCA 降维融合;
步驟5使用多种分类算法分类。
3 试验分析
试验使用P y t h o n 语言在T e n s o r f l m v 2. 0和K e r a s 2. 0. 6框架下编程开发。T e n s o r f l o w 和K e r a s 是高效 深度学习框架,提供大量程序包,快速提高开发效率。为验证笔者算法,选取了消声水池场景实验数据 和真实水下场景数据做测试,这两种试验场景涵盖了理想水下环境与真实水下环境,为验证算法在不同 环境下有效性提供了保障。
3.1试验数据集
1)消声水池数据。通过在消声水池中布置不同水下目标声响设备模拟水下目标信息感知的环境。 目标放置位置正对水听器,池边水听器阵自下而上排列,水听阵内含18只水听器,每只水听器对应相同 编号通道(s i g n a l ),其中末端水听器距离池底0.5 m ,其他水听器每个间距0.25 m 安置,阵缆共长4.5 m 。 测量时间6 min ,频带25.6 kHz 3采集的所有信号均为电压值。为实现精细化的水下目标信息感知, 尝试使用不同的功率放大器模拟不同船体的本艇自身噪声,同时,船体分别使用20%、50%
和80%的功 率在水中航行。实验环境如图4所示。
〇____船长6m ,内含振动设备
-~~~丨、
J ----------------------水池长 45 m -------------------------------------------------------------分类图4 消声水池数据监测结构图
Fig. 4 Data monitoring structure diagram of anechoic pool
依据目标的发动机功率以及不同的速度,将其定义为3类不同的目标。目标1总量4 800段,目标2
r x x x i r r x T ^
r T T T l
r x x x ^
r x x x i
5
深池沐4.5 m ■炫耀造句
■
■■■
■
第3期宋奎勇,等:面向水下多源数据特征级融合方法335
总M丨〇〇〇〇段,目标3总量3 470段,所有数据训练集占比72. 5%,测试集占比27.5%
2)真实水下试验数据。通过在实际水域中布置多个水下目标噪声采集设备收集数据。目标船只携 带发声设备在水面上按实验要求沿不同的方向以不同速度运动,采集不同声况下的数据。在真实水下场 景试验时,记录的自然环境信息:温度为6 t,湿度为39%,风速为4 m/s,气压为1.029 x 1()5Pa,水速 为 7 i n/s。
使用3路水听器组水平阵与20路水听器进行信号采集。船长6 m,近岸固定,船在江面中心线上,船头正对水听阵。船身正中位置放置,用于模拟自身噪声实验采集船体的水下噪声信号数据,按照船体 距离采集点的不同,录取多组数据。船以不同的距离和速度在水面上航行,记录水听器接收的噪声数据。
由于水面上有风浪,船体需要保持一定速度航行,距离会有误差,同时实验开始前和结束后,每段 采集了约30 min的环境噪声。实验环境如图5所示。
图5水下真实数据采集图
F i g.5 U n d e r w a t e r r e a l d a t a c o l l e c t i o n map
目标船体使用不同发声体模拟不同目标,并且以不同的速度航行。具体实验数据目标参数如表i所 示,根据发声体马力和目标距离的不同,把试验数据分成8类,同时,由于船体不固定,目标距离存在误 差,所以目标距离在一定范围内波动。
表1水下实验数据分类表
T a b. 1C l a s s i f i c a t i o n t a b l e o f u n d e r w a t e r e x p e r i m e n t d a t a
序号1234工况组别/k W8马力-100m8马力-160m8马力-200m8马力-260m 距离/m80 〜110150 〜180200 〜221257 〜266
序号5678工况组别/k W8马力-350m12马力-350m12马力-260m12马力-150m 距离/m340 〜360340 〜360220 〜255130-152
3. 2 试验验证与性能对比分析
1)参数设置与对比分析。由于水听器测量数据量较大,在使用前需要对数据进行切分。为了方便程 序计算与处理,切分大小以2的幂为基准,笔者使用3种切分大小,分别为512、1 024、2 048。并且使用 s k l e a r n包中的预处理函数M i n M a x S c a l a r把数据归一化在0 ~丨之间0最后,使用s k l e a r n包中的t r a i n—t e s t—s p l i t函数把数据集划分为训练集和测试集,训练集和测试集比例为6 :
1)八£模型参数包括输人层维数(丨叩111_出111)、编码层维数((?_(_1__(丨丨01)、权重衰变卜6丨§111_(1603>〇 和激活函数(a c t i v a t i o n)。输入层维数为512、1 〇24、2(M8 3种,编码层按照输入层50%和75%两种比例 计算,按照文献[9]的试验分析,一般情况下,降维到75%好于降维到50%的分类准确率,降维到50%高于未经降维的分类准确率。自编码网络编码层大小是输人层的75%时分
类准确率最高。例如:在试验 中按照D A E的3层结构,若输入层为1 024,并且设定编码层为输入层的75%,则编码层为768。权重衰 变为TRUE,激活函数为t a n h。
为/"展不分类效果优劣,使用丨I A、独立成分分析(ICA:I n d e p e n d e n t C o m p o n e n t A n a l y s i s)和丨S0MAP 进行数据降维融合,P C A和ICA是一种线性降维方法,I S0M A P是一种基于流行的非线性降维方法。然后,使用支持向量机(SVM:S u P P«r t V e c t o r M a c h i n e)对融合后数据分类,分类结果如表2所示。