龙源期刊网
正确理解英语写作测试的评分方法
作者:赵妮娜闫丹
来源:《中国校外教育·理论》2010年第05期
[摘要]交流是学习外语的最终目的。语言测试在经历了几个发展阶段后,已从单纯追求考
试信度过渡到注重考试效度。在笔试中提高考试的效度,意味着增加能直接测量考生语言能力
项目的比重。写作能力的测试就通常通过这种直接测试的方法来衡量考生的写作水平。本文旨
对英语写作测试的评分方法进行探讨。
[关键词]交流英语写作测试评分方法
在我国,英语并非我们的母语,英语写作是交流的主要形式之一,学习者读写能力的重要性不
言而喻。由于这个原因,写作教学历来都是外语教学中必不可少的一个环节。另外,由于大多数
的考试都是以笔试的方式进行,写作能力对考生在考试中的表现也有很大的影响。尽管写作几
乎自有史以来就一直伴随着人类社会的发展,但是人们对写作的大规模研究却是在20世纪初才
开始。在笔试中提高考试的效度,意味着增加能直接测量考生语言能力项目的比重。所谓直接
测量,即让考生在考试环境内运用被试能力。写作能力的测试就通常通过这种直接测试的方法
来衡量考生的写作水平。大规模考试中包含写作项目,无论是命题作文还是应用文,无论自由写
作程度高或低,已成为当前语言测试的一大趋势。
Heaton(2000)的研究表明,写作能力不仅是一个复杂的系统,而且是一个不断发展的系统。通
过一篇文章来正确、客观、全面地评价学习者的写作能力绝非易事。对于写作测试来说,考试
信度主要涉及评分问题。写作测试的难点在评分。很多大规模测试同时也是高风险测试,其结
果不仅关系到测试本身的质量,同时也关系到考生个人命运和社会公正等问题。因此,正确理解
并把握好写作测试的评分方法,就显得尤为重要。
在二语或外语测试中,传统的写作评分有三种:整体评分(holisticscoring)、分解评分(analytic
scoring)和客观评分(objectivescoring)。
一、整体评分(holisticscoring)或印象法(impressionmethod)
在大规模写作测试中最常用的评分方法是整体评分(holisticscoring)。所谓整体评分,就是指
评分者快速地通读待评作文,然后依据特定的评分量表(scoringscale)或者评分细则(scoringrubric)
评分。在评分过程中,评分者不打分项分。通常用1至5、1至10或1至15计分制。整体评分
的细则通常说明文本一共可以分为几个等级,并对每个等级做出解释。这种解释的详细程度在
不同的考试中会有很大的区别,但是一般都会涉及内容、组织、语言这三个方面。
龙源期刊网
整体评分的优点很突出,比如,评分效率很高,这在大规模考试中显得尤为重要;具有较高的效
度,因为它强调读者个人对文本的感受,因而更加符合自然的阅读方法……但是不可否认,整体评
分也有一些内在的缺陷,评分者所提供的单一分数信息量不足,无法帮助人们了解考生写作能力
的详细情况;信度较低,由于评分者对评分标准的把握不可能完全相同,对同一文本往往会给出悬
殊很大的分数;另外,在整体评分中很多评分者会受到一些表面因素的干扰,如文章长度和卷面整
洁程度等,这都有可能降低评分的效度(Weigle,2002:114)。
二、分项评分(analyticscoring)或分析法(analyticalmethod)
分项评分或分析法,是按语言的不同组成部分—内容、文章结构、词汇、语用、标点等五
方面分别打分,并根据考试要求决定各部分不同的权重。尤其在日常教学中,教师不大可能找到
三四个同事帮助改作业,较好的评分方法就是借助分项评分,把一篇作文分成若干项目,按照事先
集体规定的评分标准,对每项分别评分,最后统计总分数。
分项评分的最大好处是分数能提供丰富的信息,有助于提高评分信度。我们可以从不同方
面的分数中得知考生写作能力的不同侧面,并在此基础上对考生的能力做出更准确的推测。考
生很容易知道自己文章到底哪方面不符合标准。但比起整体评分,分项评分比较费时费力,在大
规模测试中不易实行;分项评分要求评分者把注意力放在对文本不同侧面的评价上,违背了一般
的阅读规律,因而降低了评分的效度(邹申,2005)……
三、客观评分(objectivescoring)或计算错误法(error-countmethod)
不受任何主观干扰的评分方法应为客观评分,即数出文章中的错误,按错误数目扣分。这种
方法看似公平,其实弊端很多。首先,错误性质不同,严重程度不同,扣同样的分数是不合理的;其
次,即使硬性规定语法错误比拼法错误严重,要多扣一倍的分数,也是主观判断而已。这种方法的
致命弱点是,它只注意文章的缺点,忽视了最根本的东西—思想表达,是否言之有物,是否达意通畅
(Heaton,2000)。
写作测试属于主观性测试,对于同一篇作文,不同的老师给的分数很可能不一样。甚至同一
位老师在不同的时间给的分数也不一样。因此,写作测试的评分主观性和片面性是不可避免
的。但是,不管采用哪种评分方法,最好设一两个巡视检查人员,随意抽查某一个评分员,看其是否
评分忽高忽低。一个人的评分始终偏高或偏低,问题倒不严重,只要坚持一个标准,最后可以校正
过来。最可怕的是忽高忽低,看不出评分标准,到头来无法校正。总之,每一种评分方法都各有自
己的优势和不足。在具体的测试中使用哪种方法,应该根据测试的目的和重要性来决定。要考
虑的因素主要包括对信度的要求、考试成绩对考生的影响与可改变性以及人力物力资源等。
参考文献:
[1]吴一安.题型与听力测试的有效性[J].外语教学与研究,2001,(02).
[2]刘建达.测试方法对阅读测试的影响[J].外语教学与研究,1998,(02).
龙源期刊网
本文发布于:2023-03-01 06:34:45,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/167762368566077.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:吴一安.doc
本文 PDF 下载地址:吴一安.pdf
留言与评论(共有 0 条评论) |