第37卷第3期 计算机应用与软件Vol37No.3
2020年3月 ComputerApplicationsandSoftwareMar.2020
基于Hough变换的答题卡识别
罗朝阳1 张鹏超2
姚晋晋1 王 彦1 赵瑞杰1
1(陕西理工大学机械工程学院 陕西汉中723000)
2(陕西省工业自动化重点实验室 陕西汉中723000)
收稿日期:2019-03-22。陕西省工业科技攻关项目(2016GY070);陕南秦巴山区生物资源综合开发协同创新项目(QBX177)。
罗朝阳,硕士生,主研领域:图像处理。张鹏超,教授。姚晋晋,硕士生。王彦,硕士生。赵瑞杰,硕士生。
摘 要 针对光电式阅卷机价格昂贵,使用成本高,设备利用率低的缺点,提出一种基于Hough变换的答题卡
识别方法。运用数字图像处理的手段,对答题卡图像进行灰度拉伸、图像滤波、图像二值化等预处理;依据Hough
变换的直线建立选项网;根据填涂区域的几何属性进行识别判断。测试结果表明,该算法对于答题卡的识别具有
高效率、高准确率、使用方便、成本低廉的特点,具有一定的应用价值。
关键词 Hough变换 自动阅卷 图像识别 答题卡
中图分类号 TP391.43 文献标志码 A DOI:10.3969/j.issn.1000386x.2020.03.042
ANSWERSHEETRECOGNITIONBASEDONHOUGHTRANSFORM
LuoZhaoyang1 ZhangPengchao2
YaoJinjin1 WangYan1 ZhaoRuijie1
1(SchoolofMechanicalEngineering,ShaanxiUniversityofTechnology,Hanzhong723000,Shaanxi,China)
2(ShaanxiKeyLaboratoryofIndustrialAutomation,Hanzhong723000,Shaanxi,China)
Abstract Aimingatthedisadvantagesoftheopticalmarkreader,suchashighprice,highcostandlowutilization
rateofequipment,thispaperproposesananswersheetrecognitionmethodbasedontheHoughtransformation.Bymeans
ofdigitalimageprocessing,greyscalestretching,imagefiltering,imagebinarizationandotherpretreatmentswere
carriedoutontheanswersheetimages.AccordingtolineoftheHoughtransformation,theselectionnetworkwas
established.Finally,werecognizedandidentifiedonthebasisofthegeometricpropertiesofthefilledarea.Thetest
resultsshowthatthealgorithmhasthecharacteristicsofhighefficiencyandhighaccuracyfortherecognitionofthe
answersheet.Anditiseasytouseandlowcost,andhascertainapplicationvalue.
Keywords Houghtransform Automaticscoring Imagerecognition Answersheet
0 引 言
考试是教育测量的重要手段,也是目前选拔人才
的重要手段。所以公平、公正就显得非常重要,这不仅
体现在考试的过程中,还体现在评卷的过程中。以前,
这些试卷都是进行人工翻阅批改,其中评卷老师的水
平、状态、情绪都能影响评卷的结果,这种不确定性有
失公平公正。随着信息技术的不断发展,计算机功能
的不断强大,出现了答题卡的计算机阅卷设备,通过电
子扫描技术将纸质的答题卡转化为数值化的形式,再
对其自动评阅,这不仅解决了评卷公正性、准确性的要
求还提高了评卷的工作效率。
目前答题卡识别方式主要有两种:一种是基于光
电设备,另一种是基于图像处理技术。光标阅读机
(
OMR)是根据光电设备将不同区域的感光能力转换
为计算机处理的电信号,再依据电信号来识别。这种
识别系统具有高效率、高准确率、低功耗的优点,但它
的缺点也很突出,即必须采用光标阅卷机和专用的答
题卡,购买成本和使用成本都非常高昂,且这种形式的
答题卡规格一旦确定就难以修改,所适用的范围小。
图像处理技术是将图兔子怎么做好吃 像采集设备所获得的图像供计算
252 计算机应用与软件2020年
机分析识别,从而获取答题卡上的有效信息。这种识
别方式不仅可以完成阅卷工作,还具有成本低廉、使用
方便的优点,而且可通过软件方便修改答题卡的结构,
以适应英语四级词组 不同的需求。
针对获得的数字化图像数据,陈淑红等[1]提出基
于纵向同步头和模板匹配的方法进行定位识别;杜聪[2]
提出模板匹配的识别方法;郝平[3]提出基于OpenCV
耦合模板定位识别。他们都是采用模板匹配的方法来
识别,识别的精度全取决于模板。本文提出一种基于
Hough变换答题卡识别算法,以此构建基于图像识别
的阅卷系统。
1 方法设计
通过相机或扫描仪采集答题卡的原始图像,当系
统获取到图像之后,先对其进行预处理操作;通过
Hough直线变换获取图像的矫正角度,并将图像进行
矫正操作,矫正后对图像进行区域分割,获得答题区域
和准考证区域以及考试科目信息区域;对这些区域进
行识别判断,以完成阅卷步骤,流程如图1所示。
图1 阅卷流程图
本文所描述的算法通过MATLAB2017b软件实
现,通过在main函数中调用其他子函数来实现图1流
程框图中的内容。
算法主程序:
I=imread(p);%p为答题卡图像的路径和名字
[I1,bw1]=Image_Preprocessing(I);%图像预处理
[~,~,xy_long]=Hough_Process(bw1);
%hough直线检测
angle=Compute_Angle(xy_long);%计算倾斜角度
[I2,bw2]=Image_Rotate(I1,bw1,angle);%图像矫正
[bw3,Loc]=Morph_Process(bw2);%形态学滤波
[Len,XYz,xy_long]=Hough_Process(bw3);%
[bw4,bw5]=Image_Segmentation(XYz,bw3);%图像分割
[stats1,stats2,Line]=Region_Label(bw4,bw5,XYz,Loc);
%区域标记
[Anss(i).Answer,Anss(i).Bn]=Analysis(stats1,stats2,
Line,I2);%区域分析
Hough检测子程序:
function[Len,XYz,xy_long]=Hough_Process(bw)
[H,T,R]=hough(bw);%hough矩阵
P=houghpeaks(H,4,′threshold′,ceil(0.3max(H(:))));
%hough峰值
lines=houghlines(bw,T,R,P,′FillGap′,50,′MinLength′,6);
%hough直线
max_len=0;
fori=1:length(lines)
xy=[lines(i).point1;lines(i).point2];
len=norm(lines(i).point1lines(i).point2);
%计算直线长度
Len(i)=len;
iflen>max_len
max_len=len;
xy_long=xy;
end%判断最长直线
XY{i}=xy;%存储直线坐标
end
[Len,ind]=sort(Len(:),′descend′);%直线长度排序
forj=1:length(ind)
XYz{j}=XY{ind(j)};
end
x=xy_long(:,1);
y=xy_long(:,2);
ifabs(diff(x))<abs(diff(y))
x=[mean(x);mean(x)];
else
y=[0.75y(1)+0.25y(2);0.25y(1)+0.75y(2)];
end%坐标调整
xy_long=[xy];%输出调整后的直线坐标
识别判断子程序(部分):
function[Answer,Bn]=Analysis(stats1,stats2,Line,Img)
aw=[′A′′B′′C′′D′];
fori=1:length(stats1)%循环所有的题目
temp=stats1(i).Centroid;
%获取当前填涂区域的坐标
fori1=1:length(Dom)%循环答题区域
Loc=Dom(i1).Loc;
%获取i1区域中的范围坐标
iftemp(2)>=Loc(1)&&temp(2)<=Loc(2)
x=Dom(i1).x;
y=Dom(i1).y;
i_y=(i1-1)20;%统计当前的题数
fori2=1:length(x)%循环i1区域中的题组
xt=x{i2};
fori3=1:length(xt)-1
%循环题组中的题号
iftemp(1)>=xt(i3)&&temp(1)
<=xt(i3+1)
i_x=(i2-1)5+i3;
%统计题号
break;
end
第3期 罗朝阳,等:基于Hough变换的答题卡识别253
end
end
i_n=i_y+i_x;
fori4=1:length(y)-1
%循环当前题号选项的个数
iftemp(2)>=y(i4)&&temp(2)<=
y(i4+1)
i_a=aw(i4);%给出答案
break;
end
end
end
end
Answer(i_n).Loc=[Answer(i_n).Loc;temp];%
Answer(i_n).no=i_n;%保存题号
Answer(i_n).aw=[Answer(i_n).awi_a];
%保存答案
end
2 图像预处理
答题卡自动阅卷系统是将图像采集设备获得的答
题卡图像传输给计算机,供其分析识别。但在获取答
题卡的数字图像过程中,常常会受到环境、设备等因素
的影响而产生噪声,从而影响阅卷的准确性。因此,要
对获取到的图像进行预处理操作,包括对图像进行灰
度拉伸、高斯滤波、图像二值化,然后再将二值化的图
像进行反转,这样就可以大大减少计算的数据量。处
理结果如图2所示。
(a)预处理后的答题卡图像
(b)二值反转后的答题卡图像
图2 预处理与二值反转后的答题卡图像
3 Hough直线倾斜矫正
3.1 Hough变换
霍夫变换是由PaulHough于1962年首次提出,仅
仅用于图像中直线的检测。现在使用的广义霍夫变换
不仅能检测直线,还可以检测其他形状的几何特征。
因为直角坐标的线与参数坐标中的点具有对偶性,从
而可将直角坐标中的线转换为参数坐标中的点。霍夫
变换就利用这一原理,将曲线的检测问题转化为寻找
峰值的问题。
在笛卡尔坐标系中一条过点(x
0
,y
0
)的直线可以
用斜截式表示:
y
0
=kx
0
+b(1)
式中:斜率k和截距b都是参数。若将x
0
和y
0
视为常
数,而将参数k和b视作变量,则式(1)改写为:
b=-kx
0
+y
0
(2)
这就将直角空间中的直线转换成了参数空间中的
点。同理直角空间中的点也可以转换为参数空间的直
线,变换如图3所示。
图3 点线对偶性
但斜截式的直线方程不能表示所有的直线,如斜
率不存在的直线,为了能表示所有的直线,采用极坐标
形式的方程来表示直线,则将式(1)改写为:
=x
0
cos
+y
0
sin
(3)
式中:
是原点到直线上最近点的距离,
是x轴与连
接原点和最近点直线之间的夹角,如图4所示。因此,
将图像中的直线与一对参数(
,
)相关联,这个参数
(
,
)平面就被称为霍夫空间。
图4 直角空间与霍夫空间
254 计算机应用与软件2020年
3.2 图像矫正
经Hough变换后,会得到很多条直线的横纵坐标,
经式(4)计算,选出其中最长的一条直线,如图5(a)所
示,并根据此直线按式(5)求出矫正角度
,最后将原
图像按式(6)矫正,矫正后的效果如图5(b)、(c)
所示。
l=(x
2
-x
1
)2+(y
2
-y
1
)槡2(4)
′=arctan
y
2
-y
1
x
2
-x()
1
180
=90-
{′
(5)
x
y
1
=
cos
-sin
0
sin
cos
0
杜甫的简介
001
x
0
y
0
1
(6)
(a)检测的最长直线
(b)矫正后的原图(c)矫正后的二值图像
图5 检测的直线图与矫正后的原图和二值图
4 形态学滤波
形态学的本质是结构元素与图像矩阵之间的相互
作用,这种早安问好 作用包括基础的膨胀和腐蚀,也包括由这两
种复合而成的开和闭。
在形态变换中,若用E(X)表示二值图像,B(X)
表示结构元素,
和
两种符号分别表示形态学运算
中的膨胀运算和腐蚀运算,则:
膨胀定义为:
E
B={x:B(x)
∩
E
≠
}(7)
腐蚀定义为:
E
B={x:B(x)
E}(8)
设和
分别是开运算和闭运算的符号,则:
开运算定义为:
E
B=(E
B)
B(9)
闭运算定义为:
EB(E
B)
B(10)
因此,本文采用的结构元素定义为:
B
1
=
000
111
000
B
2
=
00000
11111
00000
滤波算法定义为:
f=E
B
2
B
1
(11)
采用此算法对图5(c)中的二值图像进行形态学
滤波处理,并将处理后的图像中的答题边界符去除,结
果如图6所示。
(a)滤波前的二值图(b)滤波后的二值图
图6 滤波结果
5 图像分割
图像分割是指将图像划分成具有相似性质的若干
区域的过程。现有的分割方法有基于阈值分割、基
于区域分割结石疼起来怎么缓解 、基于边缘分割以及基于特定理论的分
割等[4]。
答题卡的有效信息位于图像中的特定区域,包括
准考证号区域、答题区域以及科目代号区域,对这些区
域精准定位就可以获取答题卡中的有效信息。本文采
用了基于直线的边界检测和区域分割的方法,将答题
卡化分为信息区域和答题区域两部分,分割效果如图
7所示。
第3期 罗朝阳,等:基于Hough变换的答题卡识别255
(a)直线边界检测
(b)信息区巴厘岛图片 域
(c)答题区域
图7 分割结果
6 识别判断
识别包含对信息区域中准考证号的识别、科目代
号的识别,也包含对答题区域选项的单选识别、多选识
别。通过bwlabel获取答题区域和信息区域的标记矩
阵,通过regionprops获取区域的Centroid属性,然后根
据此属性判断填涂的选项。
根据前文Hough变换获得的直线,将答题区域和
信息区域中的每个选项、信息通过网格划分出来。然
后采用图8的识别算法进行识别。
图8 识别算法
对图7(b)、(c)进行识别,识别结果如表1、表2
所示,将表1、表2中的信息叠加到原图中的效果如图
9所示。
表1 信息区域识别出的结果
试卷类型准考证号科目代号
A171923514化学
表2 答题区域识别出的结果
题号123456789
答案BABDBAABD
题号101112131415161718
答案BABBCCCBD
题号192021222324252627
答案BABCBADDC
题号282930313233343536
答案BABCBBCCB
题号373839404142434445
答案ACCAABBCABCBDACD
256 计算机应用与软件2020年
图9 识别结束后的效果
7 测试与分析
测试环境:处理器型号为Intel(R)Core(TM)i5
4210UCPU@1.70GHz2.40GHz,内存4GB,Windows
10操作系统。仿真软件为MATLAB2017b。答题卡图
像是用CCD相机在室内拍摄的100张标准答题卡,每
幅图像的大小5MB,分辨率为40003000。图像以
JPG格式保存,对拍摄的图像进行压缩,产生了马赛克
噪声,且相机本就包含CCD噪声,导致图像中也含有
了CCD噪声。
本方法是根据答题卡图像中的直线特征来识别答
题区域和信息区域,它影响着这些区域的定位精度。
直线特征在算法中有着举足轻重的作用,在本算法中
若用其他特征代替直线特征将很难定位答题区域和信
息区域。
实验共进行100份答题卡测试,每份45道题,测
试结果如表3所示。
表3 不同份数的测试结果
测试份数102050100
运行时间/s8.96517.90644.56189.042
识别准确率100%100%100%100%
识别速度/(s份-1)
0.8960.8950.8910.890
表4 不同方法的识别速度
测试方法文献[1]文献[5]文献[8]本文算法
识别速度/(s份-1)
2.9561.9340.9090.893
从表3中可以得知每份答题卡平均耗时0.893
秒,正确率达到100%,从表4中可以知道本文算法相
比于文献[1]平均耗时2.956秒、文献[5]平均耗时
1.934秒、文献[8]平均耗时0.909秒具有明显优势,
充分说明本文算法具有高效性。
8 结 语
本实验实现了答题卡的正确识别,不需要专用的
识别设备和答题卡,在普通PC机上就可实现。这不
仅降低了购买成本、使用成本,还紧张的英语 扩大了应用范围,并
且该方法的识别正确率达到了100%,识别速度为每
份0.893s。因此,本文所描述的识别方法是一种廉
价、高效、便捷、实用的阅卷方法,具有实际应用价值。
参考文献
[1]程淑红,尚果超.基于视觉的答题卡自动判分系统设计
[J].计量学报,2018,39(6):804-810.
[2]杜聪.基于图像字符识别的答题卡客观题识别方法[J].
信息与电脑(理论版),2016(15):49-51.
[3]郝平.图像处理耦合模板定位的答题卡识别研究与应用
[J].计算技术与自动化,2015,34(4):105-109.
[4]侯广峰,王媛媛,郭禾.基于CUDA的图像分割并行算法
设计与实现[J].数字技术与应用,2013(3):141-144.
[5]孙琳,张琪,罗念祖,等.一种适用于移动设备在线阅卷的
答题卡自动识别算法[J].计算机测量与控制,2018,26
(10):255-259.
[6]刘洋,黄欣.基于图像识别的网上阅卷系统的设计[J].电
子技术与软件工程,2016(19):90-91.
[7]韩涛,杨洋.基于Hough变换的图像目标检测与识别[J].
计算机与数字工程,2019,47(2):412-416.
[8]孙建芳,李万秋,张国辉,等.扫描阅卷系统中模板定制和
图像聚类方法的研究[J].计算技术与自动化,2017,36
(3):105-108.
[9]吴翔,夏英杰,李金屏.一种答题卡的自动阅读方法[J].
济南大学学报(自然科学版),2014,28(4):246-250.
[10]张站,刘政怡,吴建国,等.基于图像识别的阅卷系统的设
计与实现[J].微型机与应用,2011,30(4):44-47.
[11]吕鸣,陈治平.提高自学考试答题卡识别准确率的探讨及
实践[J].中国考试,2011(5):38-41.
[12]阮秋琦,阮宇智.数字图像处理[M].3版.北京:电子工业
大学出版社,2011:402-431.
[13]刘衍琦,詹富于.matlab计算机视觉与深度学习[M].北
京:电子工业大学出版社,2017:15-33.
本文发布于:2023-03-20 01:58:50,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/zuowen/1679248732316116.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:luozhao.doc
本文 PDF 下载地址:luozhao.pdf
留言与评论(共有 0 条评论) |