算玆语言信豔与电睡
China Computer&Communication2018年第10期档案数字化中图像倾斜检测技术的研究与应用
赖雯
(广东外语外贸大学档案馆,广东广州510420 )
摘要:档案数字化是档案部门的重点工作,但纸质档案扫描时不可避免地存在图像倾斜,进而影响档案的OCR识 别和利用。根据《纸质档案数字化规范》的要求需对扫描后的图像进行倾斜校正。笔者首先研究了常用的文本图像倾斜 技术,并选择基于Hough变换的检测方法,用于档案扫描件倾斜度的自动检测。实验结果表明,该检测方法对倾斜角的 检测平均准确率达99. 02%,算法有效。
关键词:档案数字化;图像倾斜检测;Hough变换
中图分类号:G270. 7 文献标识码:A文章编号:1003-9767 (2018) 10-028-02
The Rearch and Application of Skew Angle Estimation Technology in
Files Digitization
Lai Wen
(Archives Center of Guangdong University of Foreign Studies,Guangzhou Guangdong510420, China) Abstract:Digitalization of archives is a key task in the archives department.However,image slanting inevitably exists in the scanning of paper files,which affects the identification and utilization of OCR files.According to the requirement of"digital specification for paper archives",we need to tilt and correct the scanned images.The author first studies the commonly ud text image tilt technology,and choos the Hough transform bad detection method to automatically detect the inclination of the scanned file.The experimental results show that the average detection accuracy of the detection method is99.02%, and the algorithm is effective.
Key words:file digitization;skew angle estimation;Hough transform
i引言
麻辣土豆条档案是人们在各项社会活动中直接形成的各种形式的具 有保存价值的原始记录。为了保护纸质档案,同时,提高纸 质档案的利用效率,需对纸质档案进行扫描,转化成数字档 案。而在扫描过程中,不可避免地存在图像倾斜现象,图像 倾斜不仅影响阅读与使用,也会影响图像字符的识别准确率。因此,在档案扫描后应对图像进行倾斜校正。
火土什么字《纸质档案数字化规范》[1]中提到:对于不符合阅读方 向的数字图像应进行旋转还原,对出现偏斜的图像应进行纠 偏处理,以达到视觉上基本不感觉偏斜为准。因此,在档案 扫描验收时,需进行图像倾斜度的自动检测。
2图像倾斜检测方法介绍
纸质档案多为文字档案,因此,本文主要研究文本图像 的倾斜检测技术。文本图像的倾斜检测方法可分为四类[2]:基于Hough变换的方法、基于水平投影的方法、基于直线的
作者简介:赖雯(1990-),女,广东广州人,硕士研宄生,方法以及基于文本子区域的方法。
2.1基于Hough变换的方法
Hough变换由Paul Hough于1962年首次提出,它利用数学变换将图像空间转化为参数空间,通过计算参数空间中 曲线的峰值交点来获取图像的倾斜角[3]。
2.2基于水平投影的方法
invested
文本图像的文本行是水平排列且相邻文本行互相平行。可以将图像沿着各个角度进行投影,如果投影方向与文本行 方向相同,就会形成波峰(文本行区域)与波谷(文本行间 距空白区域)交替出现的排列图,这个投影方向与原图像的 角度即为倾斜角[4]。
2.3基于直线的方法
部分文本图像存在一些直线,且直线的方向与图像的倾 斜方向一致或垂直,因此,可以通过检测它们的直线方程来
程师。研宄方向:档案信息化、数据挖掘、图像处理。
2018年第10期
蜂蜜的作用与功效蓓e与电胭
China Computer&Communication其技语言
计算图像的倾斜角[5]。
2.4基于文本子区域的方法
文本图像可以划分为多个矩形文本子区域,且矩形文本 子区域的边界线与图像方向平行或垂直。因此,可以通过矩 形文本子区域的边界线方程计算图像的倾斜角[6]。
3基于H ou g h变换的倾斜检测技术与实现
纸质档案的扫描件具有高分辨率、低颜色分辨率和高度 结构化的特征,内容大多为文字、表格,照片较少。纯文字 档案内部直线较少,因此,使用基于直线的方法效率较低。此外,某些珍贵旧档案由于年代久远,存在缺角的情况,无 法进行准确的子区域划分。基于水平投影的方法,依赖于文 本行和文本行间距的有序分隔,用于深色背景及含有复杂版 面的图像,正确率较低。基于Hough变换的方法准确率高且 适用于多种图像情况,但计算量偏大。因此,综合考虑各方 法的优缺点,在档案扫描件的倾斜检测中,选用基于Hough 变换的方法。同时,对图像进行膨胀处理,缩小要转换的目 标区域范围,以降低算法的复杂度。
3.1 Hough变换原理
Hough变换将图像空间转换为参数空间,图像空间中的 点转换成参数空间的曲线,因此,图像空间多个点的连线对 应参数空间中多条曲线的交点。文本图像的文本行可以看成 由多条间断的直线组成,通过在Hough变换后的参数空间进 行累加统计,寻找累加器峰值的方法检测直线,并得到图像 的倾斜角。
假设直线在参数的表示形式为:P=xcos0+ysin0。其中,p为极半径,0为极角。直线在笛卡尔坐标系的表达式为
>;=女+6,直线上任意两点的坐标为(^,乃)和〇4乂_)。笛卡尔坐 标系的一个点对应极坐标系中的一
条正弦曲线。两个点则对 应两条正弦曲线,这两条正弦曲线的交点…对应原直线方 程。因此,只需要计算空间中哪个点通过的直线数量最多,就可以得到直线方程和倾斜角。
3.2基于Hough变换的倾斜检测技术实现
Hough变换具有高准确度,但是如果对文本图像的所有 点进行变换,将带来大量的计算。所以,在实际应用中,先 对文本图像进行膨胀处理,将断续的相邻文字连成一条直线。膨胀处理后进行边缘检测,并且只对边缘点进行Hough变换, 以求得倾斜角度。
基于Hough变换的倾斜检测算法步骤如下。
输人:待检测图像的路径和结果文件存放路径。
输出:含图像信息与倾斜角度的CSV文件。
步骤:读取待检测图像路径,并读取该路径下所有的图 像文件。
对每一个图像文件:
(1)进行膨胀处理,将断续的文字连成一条直线,便于直线检测。
(2)膨胀后进行边缘检测;
(3)对边缘点进行Hough变换,找到变换结果中的极
值点;
(4 )得到极值点对应的最长直线和角度;
(5 )输出图像信息与倾斜角度,将结果写人csv文件。
所有图像文件读取结束后,输出CSV文件。
4实验结果
为了测试算法的准确率,选取了 10幅文本图像,并对
图像进行9个角度(-80。~ 80。)旋转,共得到了 90幅图像。
孕期鼻炎对这90幅图像进行检测,将同一个角度的10副图像的倾斜
角求平均值统计后得到实验结果如表1所示。倾斜角度的平
连锁门店
均误差为0.45° ,而人肉眼可见的倾斜角度分辨率为0.5° ,
可见算法预测有效。
表1实验结果
实际倾斜角/。检测倾斜角/。误差/。准确率/ %
吉他保养-80-79.340.6699.18
-60-60.460.4699.23
-4040.450.4598.88
-20-20.320.3298.4
2019.780.2298.9
4039.660.3499.15
6060.330.3399.45
8080.790.7999.01
5结语
本文通过研究基于Hough变换的检测方法实现对档案扫
描件倾斜度的自动检测。实验结果表明,该检测方法对倾斜
角的检测平均准确率达99.02%,效果显著。但对于照片、图
表类档案的倾斜度检测,基于Hough变化的检测方法效果不
佳,仍然需要继续探索。
参考文献
PGIS[1] 国家档案局.纸质挡案数字化技术规范DA/T31- 2017[Z].2017.
[2] Ciardiello G,Scafuro G.An experimental system for office document handling and text recognition[C]//Proc International Conference on Pattern Recognition. 1988.
[3] Sun C,Si D.Skew and Slant Correction for Document Images Using Gradient Direction[C]//International Conference
on Document Analysis and Recognition. 1997:142-146.
[4] Yan H.Skew Correction of Document Images Using Interline Cross-Correlation[J].Cvgip Graphical Models & Image Processing, 1993, 55(6):538-543.
[5] 王姝华,李佐,蔡士杰.基于直线连续性的页面倾斜检测与校正[
J].计算机辅助设计与图形学学报,2001,13(8):736-741.
[6] 吴飞飞.文本图像倾斜校正算法的研究与应用[D].北京:北方工业大学,2014.