为啥一定要用残差图检查你的回归分析?

更新时间:2023-07-18 08:51:45 阅读: 评论:0

为啥⼀定要⽤残差图检查你的回归分析?
先说残差图究竟是什么⿁。
平开头的成语Residual Illustration
阿胶块怎么吃
激情五月丁香婷婷残差图是指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。(上图仅是残差的⽰意图,⾮残差图,残差图可见下⽂)
⽤普通最⼩⼆乘法(OLS)做回归分析的⼈都知道,回归分析后的结果⼀定要⽤残差图(residual plots)来检查,以验证你的模型。你有没有想过这究竟是为什么?残差图⼜究竟是怎么看的呢?
这背后当然有数学上的原因,但是这⾥将着重于聊聊概念上的理解。从根本上说,随机性(randomness)和不可预测性(unpredictability)是任何回归模型的关键组成部分,如果你没有考虑到这两点,那么你的模型就不可信了,甚⾄说是⽆效的。花菇的功效与作用
为什么这么说呢?⾸先,对于⼀个有效的回归模型来说,可以细分定义出两个基本组成部分:
Respon =(Constant + Predictors)+ Error
我想说的是另⼀种说法,那就是:
响应(Respon) = 确定性(Deterministic) + 随机性(Stochastic)
(有时候真是不得不吐槽下,毕竟是外国⼈发明的现代科学,中⽂翻译过来难眠有混淆视听之嫌,学术词汇的理解还是看英⽂更能清晰本质,⼀会就会聊到Stochastic就明⽩为什么这么说)
确定性部分(The Deterministic Portion)
勇气的名人名言
为了完整,先提⼀下Deterministic这部分。在预测模型中,该部分是由关于预测⾃变量的函数组成,其中包含了回归模型中所有可解释、可预测的信息。
洗地热
随机误差(The Stochastic Error)
Stochastic 这个词很⽜逼,其不仅蕴含着随机性(random),还有不可预测性(unpredictable)。这是很重要的两点,往往很多朋友都以为有随机性的特点就够了,其实不然。这两点放在⼀起,就是在告诉
10月1日我们回归模型下的预测值和观测值之间的差异必须是随机不可预测的。换句话说,在误差(error)中不应该含有任何可解释、可预测的信息。
模型中的确定性部分应该是可以很好的解释或预测任何现实世界中固有的随机响应。如果你在随机误差中发现有可解释的、可预测的信息,那就说明你的预测模型缺少了些可预测信息。那么残差图(residual plots)就可以帮助你检查是否如此了!
⼩注:回归残差其实是真实误差(ture error)的估计,就好⽐回归系数是真实母体系数(ture population coefficients)的估计。
残差图(Residual Plots)
我们可以⽤残差图来估计观察或预测到的误差error(残差residuals)与随机误差(stochastic error)是否⼀致。⽤⼀个丢骰⼦的例⼦最好理解了。当你丢出去⼀个六⾯的骰⼦时,你不应该能够预测得到哪⾯点数向上。然⽽,你却可以评估在⼀系列投掷后,正⾯向上的数字是否遵循⼀个随机模式,你⾃⼰⼼中就会想象出⼀个随机散布的残差图。如果,有⼈背着你对骰⼦做了点⼿脚,让六点更频繁的出现向上,这时你⼼中的残差图看上去就似乎有规律可循,从⽽不得不修改⼼中的模型,让你狐疑骰⼦⼀定有问题。
青天河

本文发布于:2023-07-18 08:51:45,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/1086134.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:预测   残差   模型   回归   随机性   解释   检查
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图