高维数据的低维化

更新时间:2023-07-04 23:29:12 阅读: 评论:0

高光谱成像数据的低维表示
摘要:随着大数据时代的到来,高维数据的分析越来越困难。而基于高光谱成像技术的人类情感识别所要分析的数据量的维度也是越来越大,因此,也诞生了很多降维方法。通过降维,可以非常容易地发现数据的极小维度表示,降低后期大数据分析的复杂度。通过采用这些方法进行数据降维,可以找出数据内在的相互关系,非常有利于数据分布规律的分析。
北大冬令营关键词降维高光谱成像技术;主成分分析;线性判别法;局部线性嵌入;非负矩阵分解
Lower Dimensionality of High-Dimension Data
With the large volume of data cominghigh dimensional data is very difficult to be analyzedtinThen the dimension of data on emotion recognition by hyperspectral imaging is larger and larger. So veral ways are introduced to reduce the data dimensionalityThey will show the low dimensional structure of high dimensional data, and can reduce the complexity of data analysis. After, the intrinsic connection between the data can be got easilyand is helpful to rearch the distributing rules.
Keywords: Dimension Reduction; Hyperspectral Imaging; Principal Component Analysis; Linear Discriminant Analysis; Locally Linear Embedding; Non-negative Matrix Factorization
过去完成进行时
一、研究背景
从采用各种身体信号(面部表情、语音、身体姿势) 到采用生理信号识别人类情感,从利用单一特征作为情感识别系统的输入,到融合多通道信号特征来识别人类情感,科研工作者一直在试图获取更丰富,更有效的人类情感特征用于情感的识别。光谱成像技术可远程无接触地获取所需生理情感信号,是未来情感识别的发展方向之一[1][2]
高光谱成像技术能够在可见光和红外光谱范围内的100-1000 个连续窄波段上成像,所成的图像具有3 个维度—2 block个空间维度和1 uninstall个波长维度。传统的成像技术只在3 个宽波段上成像(红、绿、蓝),每个波段的带宽在100nm 数量级上,而高光谱成像在上百至上千个波段上成像,每个波段的带宽可小于1nm,且成像波段不局限在可见光范围内。其数据量也相应以指数的量级增加,如果直接对这些数据进行处理,会有以下问题:首先,会出现所谓的“位数灾难”问题,巨大的计算量将使我们无法忍受;其次,这些数据通常没有反映出数
据的本质特征,如果直接对他们进行处理,不会得到理想的结果。所以,通常我们需要首先对数据进行降维,然后对降维后的数据进行处理。
数据降维的基本原理是把数据样本从高维输入空间通过线性或非线性映射投影到一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构。之所以能对高维数据进行降维,是因为数据的原始表示常常包含大量冗余:
a) 有些变量的变化比测量引入的噪声还要小,因此可以看作是无关的;
b) 昆明少儿英语培训哪里好有些变量和其他的变量有很强的相关性(例如是其他变量的线性组合或是其他函数依赖关系)
c) 可以找到一组新的不相关的变量;
counterproductive从几何的观点来看,降维可以看成是挖掘嵌入在高维数据中的低维线性或非线性流形。这种嵌入保留了原始数据的几何特性,即在高维空间中靠近的点在嵌入空间中也相互靠近。
数据降维是以牺牲一部分信息为代价的,把高维数据通过投影映射到低维空间中,势必会
造成一些原始信息的损失。所以在对高维数据实施降维的过程中如何在最优的保持原始数据的本质的前提下,实现高维数据的低维表示,是研究的重点。
branch
二、降维问题
1.定义
定义1.1降维问题的模型为,其中维数据空间集合(一般为的一个子集),映射
商务英语学习 
空间集合(一般是)的一个子集,我们称是数据集(到)的降维。
的线性函数,则称为线性降维;否则,称为非线性降维。
定义1.2 称映射
为嵌入映射。
2.分类
针对降维问题的目的和待处理数据集合表象维数的多少,对其进行初步的、粗略的分类如下:
1. 硬降维问题:数据维数从几千到几万甚至几十万的变化,此时需要对数据集进行严厉的降维,以至于达到便于处理的大小,如图像识别、分类问题以及语音识别问题等。
2. 软降维问题:此时数据集合的维数不是太高,降维的需求不是非常的迫切。如社会科学、心理学以及多元统计分析领域皆属于此类。
3. 可视化问题:此时数据集合的绝对维数不是很高,但为了便于利用人们的直观洞察力,即为了可视化,我们将其降到23维。虽然我们可以可视化更高维数的数据,但是它们通常难于理解,不能产生数据空间的合理形态。
若我们还考虑时间变量的话可以对降维问题进行更加进一步的分类,静态降维问题和动态降维问题。后者对于时间序列来讲是有用的,如视频序列、连续语音信号等的处理。
3.降维方法
实际处理中,由于线性方法具有简单性、易解释性、可延展性等优点,使得线性降维在高维数据处理中是一个主要研究方向。已有的线性维数约简方法,主要包括主成分分析(Principal Component AnalysisPCA)、独立成分分析(Independent Component AnalysisICA)、线性判别分析韩国艺人收入linear discriminant analysis(LDA)Fisher 判别分析(Fisher Discriminant AnalysisFDA)、主曲线(Principal Curves)、投影寻踪(Projection Pursuit, PP)、多维尺度方法(Multidimensional ScalingMDS)等。这些方法实际是在不同优化准则之下,寻求最佳线性模型,这也是线性维数约简方法的共性。

本文发布于:2023-07-04 23:29:12,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/90/167241.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   降维   问题   线性   情感   成像   进行
相关文章
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图