首页 > 试题

正偏

更新时间:2022-12-08 05:58:58 阅读: 评论:0

合肥初三冲刺班住宿-负数乘负数


2022年12月8日发(作者:七夕诗句美好诗句)

数据的偏态分布

⼀、何为数据的偏态分布?

频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置,两端的频数分布⼤致对称。

偏态分布是指频数分布不对称,集中位置偏向⼀侧。若集中位置偏向数值⼩的⼀侧,称为正偏态分布;集中位置偏向数值⼤的⼀侧,称为负

偏态分布。

如果频数分布的⾼峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布;同样的,如果频数分布的⾼峰向右偏移,长尾向左延伸

则成为负偏态分布,也称左偏态分布。

峰左移,右偏,正偏

峰右移,左偏,负偏

性质:

1、当总体分布呈对称状态时,中位数=平均数

2、当总体分布呈右偏态状态时,说明存在极⼤值,会把平均值向极⼤值⽅向拉,中位数<平均数

3、当总体分布呈左偏态状态时,说明存在极⼩值,会把平均值向极⼩值⽅向拉,中位数>平均数

偏态分布只有满⾜⼀定的条件(如样本例数够⼤等)才可以看做近似正态分布。

与正态分布相对⽽⾔,偏态分布有两个特点:

⼀是左右不对称(即所谓偏态);

⼆是当样本增⼤时,其均数趋向正态分布。

⼆、构建模型时为什么要尽量将偏态数据转换为正态分布数据?

数据整体服从正态分布,那样本均值和⽅差则相互独⽴。正态分布具有很多好的性质,很多模型假设数据服从正态分布。例如线性回归

(linearregression),它假设误差服从正态分布,从⽽每个样本点出现的概率就可以表⽰成正态分布的形式,将多个样本点连乘再取对数,就

是所有训练集样本出现的条件概率,最⼤化这个条件概率就是LR要最终求解的问题。这⾥这个条件概率的最终表达式的形式就是我们熟悉

的误差平⽅和。总之,ML中很多model都假设数据或参数服从正态分布。

本文发布于:2022-12-08 05:58:58,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/fanwen/fan/88/64222.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:连续可微
标签:正偏
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图