数据标准化的常见⽅法之Min-max
⽬录
1. 数据标准化的⽬的
高科技产品 数据标准化表⽰将数据按⽐例缩放,使之落⼊⼀个⼩的特定区间,⼀般的⽬的在于:去除数据的单位限制,转化为量纲的纯数值,便于不同单位或数量级的指标能够进⾏⽐较和加权。数据的归⼀化便是⼀个典型的案例。
1.1 数据的归⼀化励志书籍读后感
1. 把数转换为(0,1)之间的⼩数
用连也造句
2. 把有量纲的表达式转换为⽆量纲的表达式
1.2 归⼀化的好处
归⼀化的好处在于:在多指标评价体系中,由于各个评价指标的性质,通常具有不同的量纲和数量级。当各指标间的⽔平相差很⼤时,如果直接⽤原始指标值进⾏分析,就会突出数值较⾼的指标在综合分析
中的作⽤,相对削弱值⽔平低指标的作⽤。因此,为了保证结果的可靠性,需要对原始数据进⾏标准化处理。
经验上来说,归⼀化就是让不同维度之间的特征在数值上有⼀定⽐较性,可以⼤⼤提⾼分类器的准确性。
2. Min-max 标准化
mtu
2.1 定义
再回头已百年身 对序列进⾏变换:
则新序列且⽆量纲。⼀般的数据需要时都可以考虑先进⾏规范化处理。
Min-max标准化是对原始数据进⾏线性变换,将值映射到[0,1]之间。
2.2 实现代码
牡丹花花语x ,x ,...,x 12n y =i max −min 1≤j ≤n {x }j 1≤j ≤n {x }
j x −min i 1≤j ≤n {x }
j y ,y ,...,y ∈12n [0,1]
import numpy as np
import math
"""
around(arr,decimals=?)?maintain x decimals
"""
class DataNormalization:
痣相学def__init__(lf):
lf.arr = np.array([1,2,3,4,5,6,7,8,9])
lf.x_max = lf.arr.max()
技师资格证lf.x_min = lf.arr.min()
lf.x_mean = an()
lf.x_std = lf.arr.std()
def Min_MaxNorm(lf):
arr = np.around(((lf.arr - lf.x_min)/(lf.x_max - lf.x_min)), decimals =4) print("Min_MaxNorm:{}".format(arr))
if __name__ =="__main__":
a = DataNormalization()
a.Min_MaxNorm()
运⾏结果如下:
Min_MaxNorm:[0.0.1250.250.3750.50.6250.750.8751.]
本⽂参考链接: