语言教学与研究 1998年第4期
关于结构效度
张 凯
相声《吹牛》台词0.引言
陈宏(1997a;1997b)对语言测验里的结构效度问题做了深入的讨论。本文拟就这个问题再说几句。我们准备讨论以下三个问题:1.结构效度概念的形成及其背景;2.有关结构效度的讨论;3.目前对结构效度的认识和我们的看法。
1.结构效度概念和它出现的背景
1.1结构效度概念
结构效度概念是Cronbach和Meehl在1955年的一篇文章中首次提出的,这个概念一提出,就成了美国心理测量协会的一个行业标准,同时,结构效度也成了心理测验和语言测验追求的一个质量标准。结构效度的一个标准表述见于《心理学大词典》(朱智贤主编1989):“结构效度亦称构想效度,或概念效度,即测验在多大程度上正确地验证了编制测验的理论构想。一套测验的编制,往往要对所测量的心理特性提出
述职述德述廉述法报告一种理论上的设想,依此编制测验,然后检验测验结果在多大程度上符合构想的理论。”结构效度概念提出四十年来,对它的讨论、批评乃至误解层出不穷。
1.2哲学背景
公租房申请表401
结构效度理论是在逻辑实证主义影响下产生的。Messick (1989)说,“结构效度概念在50年代初被系统化,当时,在心理学,特别是在方法论方面,逻辑实证主义是一种起主导作用的势力。因此,它提供了一个现成的框架,效度概念在这个框架中形成并得以合法化,就是必然趋势了。”对结构效度理论产生了直接影响的是亨普尔(Hempel,C.G.)。亨普尔提出了两个模型,一个叫“演绎规律说明”模型(deductive-nomological model,简称D-N模型),一个叫“归纳统计说明”模型(inductive-statistical model,简称I-
S模型)(罗嘉昌1996)。按照亨普尔的观点,“整个系统(指理论系统———笔者按)浮在观察层面之上,而又靠转译规则与其相连。这可以看作是一些纽带,它们虽然不是网络的一部分,但却使网络上的某些点与观察层面的特定部位相连接。由于可通过这些联系进行转译,则这个网络可起到一种科学理论的作用:从某些观察数据,通过一条转译纽带,我们可以上升到理论网络的某一点,通过另外一条转译纽带,我们可以再回到观察层面。”(亨普尔1952,转引自Messick1989)亨普尔这段话有助于理解结构
张学红效度概念。
1.3建立结构效度理论
Cronbach和Meehl把亨普尔的理论引进心理测量领域。他们认为,“要建立一个测量结构的测验,就要求有一个严格的(虽然可能是概率上的)推论环节。要证明一测验有效地测到一个结构,就一定得有一个围绕着概念的定律网络。”换句话说,“一结构可被科学地接受的必要条件是,它必须存在于定律网络之中,至少其中的某些定律要包含可观察的东西。”(Cronbach&Meehl1955,转引自Messick1989)于是,Cronbach(1971,转引自Messick1989)说,“结构效度理论,是按科学哲学的正规方式表述的。”
在测验中建立结构效度的大致过程是:(1)提出一个假说性结构,假设用它来解释测验表现;(2)从产生结构的理论中推导出关于测验表现的一个或几个假设;(3)用逻辑的和经验的方法对假设
501
土方施工方案进行检验(Popham1988)。如果测验结果出现了我们假设的行为,那么测验就是有效的,同时,我们的理论假设也得到了证明。
春季蔬菜1.4关于“结构”
在心理学中,像“焦虑”、“能力”等概念都是“结构”;在语言测
“交际能力”、“熟巧程度”也都是“结构”。这验领域,“语言能力”、
些概念“描述的不是一个行动,而是思想、行动特有的组织和效率。”(Cronbach1990)
为什么要使用“结构”这个词呢?Cronbach(1971)解释说,“我们可以使用概念这个术语而不使用结构,但后一术语在于强调那些范畴是一些精心创造的产物,可以用来把经验纳入具有定律性质的普遍陈述。”(转引自Bachman1990)这就涉及到“结构”(con2 struct)这个词的本义。construct来源于construe,前者的一个意思是“思维的产物”,而后者的意思是“解释”。因此,“一个结构就是以一种方式对观察到的东西进行解释———即把观察到的东西组织起来。”(Cronbach1990)
1.5结构效度的特殊性
乡土中国在线阅读在测验理论中,有好几个效度,如内容效度、预测效度、效标关联效度等,这些效度指的都是测验的性质。结构效度和它们不一样,它不仅指测验的效度,亦即平常所说的“是否测到了要测的东西”,而且它也指理论假设是否得到了经验数据的证明。因此,结构效度既和观察层面有关,也和理论层面有关。这样我们就可以大致理解Cronbach把亨普尔的理论引进测验的理由,也可以理解他何以要使用“结构”而不使用“概念”。
2.批评和讨论
结构效度理论提出以后,结构效度问题就成了心理测量和语言测量里的最重要的问题,凡是涉及人的心理特质和深层能力的测验,无不追求结构效度。但同时,对结构效度理论的批评也不断601
出现。在这些批评意见中,人们并不是要否认结构效度对测验的重要,而是说结构效度理论(尤其是早期的)有这样或那样的问题。
2.1关于定律网络
当Cronbach和Meehl引进亨普尔的理论,把结构效度理论作为一个定律网络提出来后,人们就对这个东西提出批评,原因是人们不理解这个东西,用Cronbach(1989)的话说,“很多人被这个哲学原理搞懵了。”我们刚才说过,Cronbach和Meehl是想按实证主义思想使心理测量学获得一定的理论高度,因此,Meehl和G olden(1982)对这个思想又做了进一步的解释:“理论概念是在一个定律或统计‘规律’的网络中获得定义的,对其进行定义的正是这些概念在网络中的作用,而这种定义是概念化的或含蓄的。概念的意义部分地来自理论框架自身,而不论这框架可能是多么地脆弱和单薄。说到一个实体,你是根据有关它的理论陈述在何种程度上与观察陈述相连而得知其意义的。这些陈述是说它在哪儿出现、它有何影响、它会如何以及它由什么组成。这些特性只有极少数是可以直接观察的。”(转引自Cronbach1989)Cronbach (1989)说,这个理论的“理想是把科学知识‘重建’为一个演绎系统。一个概念可视为有定律性质,仅当其被放入‘一个已建好的科学演绎系统’,同时,仅当其陈述了何处出现某条件,
就会发生某事时,它也就具有定律性质。即使在50年代,哲学家也是很谨慎地说,这类系统只能近似地得到,只能在成熟的科学中得到,而在心理学中,这种强式理论最多是遥远未来的希望。”因此,“把结构效度与演绎连在一起,是一个策略上的错误”,并且,“给不成熟的科学穿上实证主义外衣是矫饰的,而说结构若不是定律网络的一部分就不可科学地接受,则是自拆台脚。”(Cronbach1989)“放弃假设—演绎模型的策略对于一门抱负不凡的科学来说是危险的”(鲁宾逊、丹尼尔・N.1979),所以,尽管Cronbach承认把结构效度纳入科学演绎系统是有问题的,但这个做法仍然是有
701
意义的,并且它是产生了巨大影响的,因为从过去到现在,人们仍不想完全放弃这个理想。比如,Compbell(1960)对这个理论就表现出既赞同又犹豫的态度,他担心,结构效度理论给自己开价太高而失去市场,因为心理学家的观念不像物理学那样具有演绎的力量。所以他建议,心理学家应该把理想的定律系统放在一边,而去致力于建立他提出的“特质效度”(转引自Cronbach1989)。但是他的建议并没有引起人们的重视(Cronbach1989)。
2.2操作主义
对结构效度理论的另一个批评,是说它采用了操作主义。哲学家一般认为,操作主义作为一种哲学几乎毫不足取,心理学家信奉操作主义使哲学家感到大惑不解。张恒远
在哲学上,极端的操作主义会导致唯心主义,因为操作主义认为操作是第一性的(高清海主编1988)。“在心理学中采用操作主义,固然有其客观性优点,但其局限也很明显”,因为“使用不同的测验,就有不同的智力定义。”(朱智贤主编1989)
现在,至少在一部分科学家那里,操作主义已经从一种哲学的地位降到一种方法的地位。科学家们的态度是,“在任何科学研究中所遵循的方法都是如此重要,因而没有什么有名望的科学家会承认另一位科学家的研究成果,除非他确切知道在得到这些成果中所采取的程序如何”,“任何科学发现或概念的有效性取决于达到该发现或概念所采取的程序的有效性。”(查普林、克拉威克1979)这也就是说,“他人的证据在科学研究中起着根本性的作用。”(特拉斯特德,J.1979)研究程序应该是可以由别人重复的,科学结论应该是可以由别人验证的,否则,我们无法知道一个理论是否可靠。唐钺(1994)把这看成一种科学方法,称为“操作主义的第二个意义”。普特南(1981)把这叫做“淡化了的操作主义”,尽管他对此不以为然,但他也承认“至少专家们似乎是意见一致的”。
2.3导致主观臆断
801