“定量”与中青班
“量化”
作者:赖庆来源:定量群学
这篇东西注定是要贻笑大方的,但我的目标读者是学生。朋友告诉我,中国社会学界的年轻人不易,还没走两步,就是岔路口,每条路都望不到头,头顶的大喇叭却此起彼伏,催着赶紧下脚。找到方向的人自有定力,对大喇叭们早已连眼珠子也不转过去,可是一批又一批的年轻人,仍在彷徨无计。希望下面这些文字能够帮助年轻学生厘清一些头绪,在方法的岔路口作出合适的选择。
1
必也正名乎
中国的社会学界,常常听到对 “定量”或“量化”的批评,最近好像又有一些声音。我认为,批评可以,但首先有必要区分一下“定量”和“量化”,因为它们实在不是一回事,尽管写成英文都是quantitative.
Quantitative只是个一般意义上的形容词,跟数量有关的就都是 quantitative;但“定量”和“量化”这两个译法,却十分敏锐地抓住了即便在英语训练中也无人强调的两种不同的含义。我的理解是这样的,所谓“定量”,就是“定于量”,也就是把数值确定下来。这样的数值,本身就是有意义的,这个意义不是修辞意义,而是实在意义。也就是说,它们本身就是问题的真实答案。因此,定量研究问题通常直截了当——中国女性一生平均生多少孩子?美国各类跨种族通婚率分别是多少?某职业培训政策导致目标人群的劳动参与率上升多少?诸如此类。
我和我的合作者曾使用中国西北地区的调查数据写文章,因为涉及家庭观念,想要引用一下回汉通婚率,结果,大量的文献只是说这个有影响、那个有影响,就是没有通婚水平。也就是说,这是一个有人感兴趣、却尚未被解决的定量问题,于是我们另写了一篇文章,用小普查算出回汉通婚水平,并描述和诠释了其地域差异和历史趋势。
对于这类需要用数值去直截了当地回答的问题,如果一定要去附会什么理论,那就是犯了八股病。当然了,稍作铺垫也不是不可以,毕竟搞学术是要适当踩一踩巨人肩膀的。但老实说,假如让我去读一篇关于高等教育回报率的定量文章,我会跳过人力资本理论(如果有的话),先翻到后面去看那个百分比,而且我不觉得这样做有什么错。
刚才说了,定量研究要定的量,本身就是问题的答案,而好的定量研究,就是重要问题的正确答案。什么问题重要,各花入各眼,但有一点是肯定的,那就是定量研究不吝于把功夫花在技术细节上。既然做定量,就是要追求精确,如果硬要说这是方法主义,那也无法可想。举个例子,中国的总和生育率到底是 1.18 还是 1.65,这是个很重要的、值得反复推敲的问题,在这个问题上,进一寸不但有一寸的欢喜,还有远超一寸的价值。定量研究的人文关怀,就在于把数算对,不夸张地说,这是一个操守问题——实际上,很多令人尊敬的定量研究使出100%的力气,只是为了把结果的质量提高1%。
那么,什么是“量化”呢?顾名思义,就是“化为量”,即先把概念化为变量,然后探索变量之间的关系,最后再上升到理论。在我看来,量化与定量不同,量化研究中的数值不具有实在意义,它们只是对诸概念及其关系或精致或粗糙的模拟。换言之,量化是一种基于数量的修辞。在这一层,量化和质化方法并没有本质区别,二者都是为讲故事而服务,其核心策略都是构建 metaphor,不过前者求诸数量关系,后者求诸语义之网而已。
我无论是读量化文章,还是自己写,最重视的部分是研究假说,因为那是故事的纲领。如果故事不好,后面的统计分析再怎么精益求精,也是白给(这才是方法主义);反过来,
如果故事特别好,那么数据分析只须套路演足、中规中矩,对具体数值一般不必穷究。很多人都会同意,读有些文章的分析结果,究竟是 0.5 还是 0.6、一颗星还是两颗星,都没什么要紧,只要结果大致合于研究假说,就算是为故事提供了基于量化修辞的“经验”证据。这种文章,自然就是量化文章。
再植入一则广告吧,我和一个朋友最近合写了一篇量化文章,前半部分从中国的社会和历史背景推出四条叙事性的研究假说:1)当代中国人的发展观受到国际主流发展话语的影响,呈现高度的一致性;2)即便如此,西北穆斯林和非穆斯林汉族的发展观仍有显著差异;3)西北穆斯林基于宗教认同,对伊斯兰国家的发展程度有着更高的评价;4)除了这一宗教因素,穆斯林和汉族人的发展观就没有显著差异了。其实,文章到这儿已经定调了,剩下的就是使用一个600多人的样本,跑出各种OLS回归、中位数回归、多层线性模型,依次证明这四个假说成立。我相信,即便读者没弄明白后面的技术细节,也不影响她/他搞清楚我想说的故事——只是说服的效果要打个折扣。我还相信,如果我手上不是一个调查样本,而是一套访谈数据,也可以讲出同样的故事。
总而言之,定量和量化虽然统称 quantitative,实则大异其趣。定量旨在事实,逻辑和经验
密切辨证,直来直去,向目标结果步步逼近;量化旨在理解,理论与证据互相发明,温文尔雅,把一个故事娓娓道来。同样是数,定量研究中的数有其独立的重要性和真实性,若数字确信可靠,要把它当作事实记住;而量化研究中见到的数,不过是为了实现论证目的修辞碎片,重要的是它们背后的意思,读完文章,只要对议题增进了理解,具体数字完全可以忘掉。定量研究不依赖过多的理论铺设,其重要性不证自明,只要把问题问清楚,甚至连研究假说也是多余;然而量化研究的灵魂却在于理论动机,其数据分析部分若无研究假说加以规约,则无异于盲人摸象。
2
刀叨二法
说的极端些,定量和量化可以说来源于不同的“血统”。定量是从大量信息中析出具有真理性的简约的数量性知识,有着浓浓的现代科学的还原主义意味,本质上属于降维思维。与之相反,量化研究的长处在于它能够容纳和揭示社会异质性,其精神完全合于韦伯式的阐释性理解(interpretive understanding):以概念(理想型)为分析工具,喂之以经验材料,把观念、行动、关系、过程层层剥开、细细铺陈,深描其方方面面的意义,同时,有
节奏、有章法地加以辨证分析,总结其结构性特征。这种阐释性致知的研究活动,本质上属于人文传统的增维思维。说句题外话,韦伯要是活在今天,不知要跑出多少形式优美、意境高远的量化模型——实际上,在当今经济社会心理政治各科,确实仍有无数量化研究者活在韦伯的余荫下。
对应于quantitative 的科学和人文两脉,我戏称定量为“刀”式研究(奥卡姆剃刀),实在知识,越削越精;而量化则为“叨”式研究,社会百态,越叨越明。前一阵子有朋友写了一篇文章,呼吁社会学超越人文和科学的纠结,可是在我心目中,人文和科学早已经在 quantitative sociology 的刀叨二法中对立统一了。
再说一句题外话,刀叨二法不仅为 quantitative 所专美,qualitative 也有定性和质化之分,比如,服务于民族识别的前苏式民族研究就是定性,而晚近西方文化人类学影响下的民族研究则多属质化增维活动。这说明,方法全在一个“用”字,人是方法的主人,人指哪,方法就打哪。没错,狗也会咬主人,但是与其害怕被方法反噬,不如自己变得强大,强大到可以驾驭方法。
3
学术训练
但要驾驭方法,又谈何容易。我国社会学的 quantitative 训练,一言以蔽之,就是定量学不到,量化学不好。
总的来说,定量研究在人口研究领域比较常见,因为出生死亡迁移之类,有其自带的实在性,你很难说它是建构出来的飘渺之物。人口领域的定量研究是严格的问题导向,具体问题具体分析,解法不拘一格,因此很难通过方法课程加以训练,主要靠传帮带和自己琢磨。此外,劳动经济学也是定量研究为主导,但相比于人口学的参差多态,劳经主要泛滥着各种程式化的所谓因果推断。不过,经济学的叫法不同,我所谓的定量,他们称之为 empirical 或 reduced form,而他们口中的 quantitative 则另有所指,这个需要另文专论。我们的问题在于,社会学系很少跟人口研究或劳动经济有交集,国内社会学的定量训练尚处于起步阶段——尽管在少数精英学校,某了不起的狐狸爸爸读后感
些可用于定量的所谓因果推断技术也已经不再是什么新鲜事。
量化却有所不同,量化研究的立意虽是高度个人化的东西,其方法却是可以量贩的,社会学系的统计方法课,以及这些年各地流行的暑期方法培训班,育人无数。这种课程通常都
是标准程序,从变量类型入手,根据不同情况作各种统计描述和推断,之后介绍回归框架下的各种名目,以探索变量之间的关系。但是,量化研究的起点并不是变量,按照顺序,先要把理论概念实质化(所谓操作化),然后把实质内容数量化(所谓测量),最后才轮到对变量作统计分析。稻香湖公园
也就是说,要想做好量化研究,统计训练之外,社会学学生还要花费大量时间精力用来培养理论素质和积累实质性知识。由于这些额外的功夫,再加上中国较短的学制,年好品质
轻人要想把量化方法学好用好,殊非易事。
4
娜拉走后
然而,即使面临着许多困难,这十数年来quantitative 在中国社会学界仍实现了大规模的普及和进步。干的多了,难免出些糙活,这就时常引出有识之士的批评。我同意现状并不令人满意,娜拉必须出走,问题是,娜拉走后怎么办?