偏差(bias)和⽅差(variance)
偏差:描述的是预测值(估计值)的期望与真实值之间的差距。偏差越⼤,越偏离真实数据。如下图第⼆⾏所⽰。
⽅差:⽅差是数据偏离平均数的程度,描述的是预测值的变化范围,离散程度,也就是离其期望值的距离。⽅差越⼤,数据的分布越分散,⽅差可以表⽰⼀组数据在均值周围的聚集密度,如下图右列所⽰。
标准差:⽅差开⽅即得到标准差 standard deviation, The standard deviation tells you how tightly your data is clustered around the mean
协⽅差:是统计学中使⽤的⼀种数值,⽤于描述两个变量间的线性关系。两个变量的协⽅差越⼤,它们在⼀系列数据点范围内的取值所呈现出的趋势就越相近(换句话说,两个变量的曲线距离彼此较近)。⼀般来说,两组数值x和y的协⽅差可以⽤这个公式计算:1/(n -1)Σ(xi - xavg)(yi -yavg)。其中n为样本量,xi是每个x点的取值,xavg为x的平均值,yi和yavg也类似。Covariance is a measure of how much two random variables vary together. It’s similar to variance, but where variance tells you how a single variable varies, co variance tells you how two variables vary together
⽅差的计算公式
(s2) = Σ [(xi - x)2]/n - 1
s2 = ⽅差
Σ = 求和,表⽰后⾯所有项的和。
xi = 样本观察值,表⽰各项数据
x=平均值,表⽰所有数据的平均。
n = 样本⼤⼩。就是数据的个数