调节变量,中介变量和控制变量啥区别与联系?
看看“机制分析, 中介渠道, 调节效应必读系列合集”, 写文章可以写得有些深度。机制分析能够帮你回答Why?知其然,知其所以然,往往能够增加文章分析深度。但是清晰理解Mediator, Moderator, Covariates这些概念以及逻辑,是开展机制分析的前提条件。如果对图论比较感兴趣,还建议看看“用"因果关系图"来进行因果推断的新技能”。
1
控制变量 Covariate
可以看看“什么是不好的控制变量, 什么又是好的控制变量?”
控制变量:这些会影响因变量的因素是研究者不愿意看到的,它们的存在会干扰研究者分析自变量对因变量的影响。控制变量又称为“额外变量”,是必须被想办法施加控制或采用统计方法排除干扰的因素。
如果感觉上面那段话太抽象,我下面说个具体的例子解释一下。就像昨天那出戏,我们想
知道年轻人生活地点的差异会不会影响结婚年龄,但千人千面,漂亮的讨人喜欢,丑了自然在婚恋市场上行情堪忧。因此将长相列为控制变量,就是排除这各因素的影响,让我们能够聚焦于地点差异对结婚年龄的影响。
科学研究中,我们通常不可能保证控制变量全部相同,而是采取统计方法排除其对因变量的影响。然而在现实生活中,我们很难做到这种“统计排除”。所以,理解控制变量实际上就是让我们分析因果(自变量影响因变量)关系时,留意是否有需要控制的因素没有被控制,如果没有控制,那我们就有理由怀疑这种因果关系。
值得强调的是,并不是除了自变量外所有能影响因变量都是控制变量,中介变量和调节变量都能影响因变量。因此控制变量是一个相对的概念,主要看我们的研究目的或要弄清的问题。比如讲生活地点对结婚年龄的影响,就要控制长相因素,如果我们研究长相对结婚年龄的影响,那长相就是自变量了。
调节变量(moderator)和中介变量(mediator)是两个重要的统计概念,它们都与回归分析有关。相对于人们关注的自变量和因变量而言,调节变量和中介变量都是第三者,经常被人混淆。从文献上看,存在的问题主要有如下几种: (1)术语混用或换用,两个概念不加区分。例如,
在描述同一个过程时,既使用调节过程的术语又使用中介过程的术语(2)术语和概念不一致。如研究的是调节过程,却使用中介的术语。(3)术语和统计分析不一致。如使用了中介变量的术语,却没有做相应的统计分析。出现前面的任何一个问题都会使统计结果解释含糊不清,往往导致错误结论。仅在儿童临床心理和少儿心理方面的研究文献中, Holmbeck就指出了不少误用的例子。
国内涉及中介变量的文章不多,涉及调节变量的就更少。从国外的情况看,一旦这方面的定量分析多起来,误用和混用的情况也就可能多起来,所以让应用工作者正确理解和区分中介变量和调节变量,会用适当的方法进行统计分析,对提高心理科学的研究水平具有积极意义。
2
调节变量
可以看看“计量经济学中"交互项"相关的5个问题和回应”
如果变量Y与变量X的关系是变量M 的函数,称M 为调节变量。就是说, Y与X 的关系受到第三个变量M 的影响。调节变量可以是定性的(如性别、种族、学校类型等) ,也可以是定量的
(如年龄、受教育年限、刺激次数等) ,它影响因变量和自变量之间关系的方向(正或负)和强弱. 例如,学生的学习效果和指导方案的关系,往往受到学生个性的影响:一种指导方案对某类学生很有效,对另一类学生却没有效,从而学生个性是调节变量。又如,学生一般自我概念与某项自我概念(如外貌、体能等)的关系,受到学生对该项自我概念重视程度的影响:很重视外貌的人,长相不好会大大降低其一般自我概念;不重视外貌的人,长相不好对其一般自我概念影响不大,从而对该项自我概念的重视程度是调节变量。
在做调节效应分析时,通常要将自变量和调节变量做中心化变换(即变量减去其均值)。
最简单常用的调节模型,即假设Y与X 有如下关系
Y = aX + bM + cXM + e (1)
可以把上式重新写成
Y = bM + ( a + cM ) X + e
对于固定的M ,这是Y对X 的直线回归。Y与X 的关系由回归系数a + cM 来刻画,它是M 的线性函数, c衡量了调节效应(moderating effect)的大小。
调节效应与交互效应
对模型中调节效应的分析主要是估计和检验c。如果c显著(即H0∶c = 0的假设被拒绝) ,说明M 的调节效应显著。熟悉交互效应( interactioneffect)的读者可以从模型看出, c其实代表了X与M 的交互效应,所以这里的调节效应就是交互效应。这样,调节效应与交互效应从统计分析的角度看可以说是一样的。
然而,调节效应和交互效应这两个概念不完全一样。在交互效应分析中,两个自变量的地位可以是对称的,其中任何一个都可以解释为调节变量;也可以是不对称的,只要其中有一个起到了调节变量的作用,交互效应就存在。这一点从有关讨论交互效应的专著中可以看出(例如,显变量之间的交互效应,潜变量之间的交互效应 。但在调节效应中,哪个是自变量,哪个是调节变量,是很明确的,在一个确定的模型中两者不能互换。例如,要研究数学能力的性别差异,将年级作为调节变量,这个问题关注的是性别差异,以及性别差异是否会随年级而变化。如果从小学一年级到高中三年级都获得了各年级学生有代表性的样本,每个年级各用一份测试题,所得的数据就可以进行上述分析。但同样的数据却不能用于做年级为自变量、数学能力为因变量、性别为调节变量的分析,因为各年级的测试题目不同,得分没有可比性,因而按调节
效应的分析方法 ,分别不同性别做数学能力对年级的回归没有意义。要做数学能力对年级的回归,应当用同一份试题测试所有年级的学生。
调节效应分析方法
调节效应分析和交互效应分析大同小异。这里分两大类进行讨论。一类是所涉及的变量(因变量、自变量和调节变量)都是可以直接观测的显变量(obrvable variable) ,另一类是所涉及的变量中至少有一个是潜变量( latent variable) 。
显变量的调节效应分析方法 调节效应分析方法根据自变量和调节变量的测量级别而定。变量可分为两类, 一类是类别变量( categoricalvariable) ,包括定类和定序变量,另一类是连续变量( continuous variable) ,包括定距和定比变量。定序变量的取值比较多且间隔比较均匀时,也可以近似作为连续变量处理。表1分类列出了显变量调节效应分析方法。
当自变量和调节变量都是类别变量时做方差分析。当自变量和调节变量都是连续变量时,用带有乘积项的回归模型,做层次回归分析: ( 1)做Y对X和M 的回归,得测定系数R21。( 2)做Y对X、M 和XM 的回归得R22 ,若R22 显著高于R21 ,则调节效应显著;或者,做XM 的偏回归系数检验,若显著,则调节效应显著。