逻辑蜗牛历险记 回归的越⾼拟合程度越⾼_线性回归拟合优度的度量:R
平⽅
线性回归 Y = ax + b 的拟合程度,都是⽤ R 平⽅来进⾏判定,所以本篇⽂章来梳理 R 平⽅的具体计算⽅式。
⾸先,根据这⼀回归⽅程,可以依据⾃变量 x 的取值来预测因变量 Y 的取值。但预测的精度取决于回归直线对观测数据的拟合程度。各个
观测点(也就是训练集的数据)越是紧密围绕直线,说明直线对观测数据的拟合程度越好,反之则越差。
两个变量的相关分析中,我们⽤相关系数来衡量,Pearson 相关系数就是 R 值。这个在《相关系数之Pearson》有过介绍。
R 值的作⽤也很清楚。判断⾃变量与因变量的关系,以确定该⾃变量有没有纳⼊回归⽅程的必要。如果是⼀元回归,就是有没有做回归分析
的必要。⼀般情况下,如果 R 低于 0.5,则这个⾃变量不需要纳⼊回归⽅程。另外⼀个就是上⾯说的,衡量预测的精度。
再来介绍下 R 平⽅。 可以理解为 Pearson 系数的平⽅,但计算⽅法是通过类似⽅差分析的⽅法得到的。R 平⽅⼜叫决定系数,反应因变
量 Y 的总变异中回归关系所能解释的百分⽐。如图,如果 R 平⽅值 0.6326,代表的是总变异中回归关系可解释部分的占⽐为 63%。
R 平⽅的公式如下qq刷会员 :
每个观测点的离差,⽐较直观的是直接王者开黑名字 在坐标系上表现,其中:
是 SSR。也就是因为⾃变量 x 的变化,引起的 y 的变化,代表回归关系中可被解释
的部分。
图:统计学-贾俊平
SSR(回归平⽅和):样本平均值与预测值的差的平⽅俄罗斯足球 和,由 x 与 y 的线性关系引起的 y 变化,代表回归关系中可被解释的部分。
SSE(残差平⽅和):样本观测值与预测值的差的平⽅和,除 x 影响之外的其他因素引起的 y 变化,代表回归关系中不可解释的部分。
SST(总平⽅和):样本观测值与样本平均值的差的平⽅和,代表总的变异程度。
从图中和公式可以看出,SST = SSR+ SSE ,总变异来⾃两个⽅⾯的影响,⼀个是来⾃因变量 x 的影响(SSR),⼀个是来⾃⽆法预测的残
差⼲扰(SST),搬迁协议 想要回归直线拟合的越好,就需要让能被回归可解释的部分(SSR/SST)占⽐越⾼,⽆法被回消石利胆胶囊 归解释的部分(SSE/SST)占⽐
越⼩。
总结下,平⽅值是取值范围在 0 到 1 之间,当趋势线的 R 平⽅值等于 1 或接近 1 时,意味着⼤部分 Y 的总变异可以被回归⽅程式的 x 变
化所解释,模型拟合程度的越⾼,可靠性越⾼,反之则可靠性较低。
本文发布于:2023-04-24 14:59:41,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/89/845957.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |