归一化、标准化、单位化方法的总结

更新时间:2023-07-18 02:41:30 阅读: 评论:0

归⼀化、标准化、单位化⽅法的总结
归⼀化:常⽤的⽅法是对原始数据进⾏线性变换把数据映射到[0,1]或者[-1,1]之间。变换⽅法见下⽂⼀、⼆。不同变量往往量纲不同,归⼀化可以消除量纲对最终结果的影响,是不同变量具有可⽐性。在不涉及距离度量、协⽅差计算、数据不符合正态分布时,可使⽤归⼀化⽅法。⽐如图像处理中,将RGB图像转换为灰度图向后,将其值限定在[0,255]的范围等。
标准化:常⽤的⽅法是z-score标准化,镜柜处理后数据均值为0,标准差为1。该标准化⽅法要求原始数据的分布可以近似为⾼斯分布,均值为0,标准差为1,。在分类、聚类算法中,需要使⽤距离来度量相似性的时候,或者PCA技术进⾏降维的时候,Z-score standardization表现的更好。
单位化:单位化处理⽐较简单。就是每个矩阵除以他⾃⼰的模。模的计算时矩阵中每个元素的平⽅和再开⽅。
⼀、L1 normalization, L2 normalization, Lp normalization
⽆论传统图像处理,还是深度学习,我们经常会听说存在L1 normalization,L2 normalization,那么这些归⼀化是什么呢?在统计学习中,归⼀化的具体作⽤是归纳归⼀样本的统计分布性。归⼀化在0~1之间是统计的概率分布,归⼀化在-1~+1之间是统计的坐标分布。即该函数在(负⽆穷,正⽆穷)的积分为1。
下图为pytorch官⽹normalize的定义和实现⽅程
从公式中可以看出这是⼀个Lp normalize,p表⽰1,2,...,n。sigma是⼀个极⼩的⼩数,为了防⽌分母为0时所做的处理。
⽐如存在数:
L1 normalize的结果和L2 normalize的结果如下:
pytorch计算结果:
Lp normalization归⼀化范围:[-1, 1]
如何群发qq消息所以往后可以使⽤Lp normalize了,⽅便简单。
⼆、使⽤最⼤最⼩值进⾏归⼀化处理
羊水标准
1. Rescaling
其中:
min(x):数据分布的最⼩值
max(x):数据分布的最⼤值
作⽤:计算出每个样本的⽐例值。
作⽤:计算出每个样本的⽐例值。
取值范围:[0,1]
2. Mean Normalization
毛泽西
其中:
mean(x):数据分布中的均值
名著阅读网min(x):数据分布的最⼩值
max(x):数据分布的最⼤值
作⽤:计算出每个样本的⽐例值。
取值范围:[-1,1]
三、符合正态分布的标准化处理
什么是外贸常⽤的⽅法是z-score标准化,镜柜处理后数据均值为0,标准差为1。
其中:
天下起雨u:表⽰均值,mean
天使雕像sigma:表⽰标准差,std
标准化处理就是数据减去均值然后除以标准差,使其分布符合正态分布。标准差 = ⽅差的算数平⽅根
该标准化⽅法要求原始数据的分布可以近似为⾼斯分布,均值为0,标准差为1,。在分类、聚类算法中,需要使⽤距离来度量相似性的时候,或者PCA技术进⾏降维的时候,Z-score standardization表现的更好。
四、使⽤最⼤最⼩值进⾏归⼀化处理。
Scaling to unit length
燕麦片的功效单位化处理⽐较简单。就是每个矩阵除以他⾃⼰的模。模的计算时矩阵中每个元素的平⽅和再开⽅。

本文发布于:2023-07-18 02:41:30,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1085809.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:分布   处理   均值   标准化   数据
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图