字符识别方法归纳

更新时间:2023-06-15 02:22:43 阅读：评论：0

字符识别

边的笔画顺序

一、理论

1.结构模式识别：根据字符结构特征进行识别，可用来识别汉字，但抗干扰能力差。可用来识别少量和简单的字符，如数字。

2.统计模式识别：其要点是提取待识别模式的的一组统计特征，然后按照一定准则所确定的决策函数进行分类判决。

常见的统计模式识别方法有：

(1) 模板匹配。模板匹配并不需要特征提取过程。字符的图象直接作为特征，与字典中的模板相比，相似度最高的模板类即为识别结果。这种方法简单易行，可以并行处理；但是一个模板只能识别同样大小、同种字体的字符，对于倾斜、笔划变粗变细均无良好的适应能力。

(2)利用变换特征的方法。对字符图象进行二进制变换(如Walsh, Hardama变换)或更复杂的变换(如Karhunen-Loeve, Fourier,Cosine，Slant变换等)，变换后的特征的维数大大降低。但

是这些变换不是旋转不变的，因此对于倾斜变形的字符的识别会有较大的偏差。二进制变换的计算虽然简单，但变换后的特征没有明显的物理意义。K-L变换虽然从最小均方误差角度来说是最佳的，但是运算量太大，难以实用。总之，变换特征的运算复杂度较高。取长补短的意思

(3)投影直方图法。利用字符图象在水平及垂直方向的投影作为特征。该方法对倾斜旋转非常敏感，细分能力差。

(4)几何矩(Geometric Moment)特征。M. K. Hu提出利用矩不变量作为特征的想法，引起了研究矩的热潮。研究人员又确定了数十个移不变、比例不变的矩。我们都希望找到稳定可靠的、对各种干扰适应能力很强的特征，在几何矩方面的研究正反映了这一愿望。以上所涉及到的几何矩均在线性变换下保持不变。但在实际环境中，很难保证线性变换这一前提条件。

(5)Spline曲线近似与傅立叶描绘子(Fourier Descriptor)。两种方法都是针对字符图象轮廓的。Spline曲线近似是在轮廓上找到曲率大的折点，利用Spline曲线来近似相邻折点之间的轮廓线。而傅立叶描绘子则是利用傅立叶函数模拟封闭的轮廓线，将傅立叶函数的各个系数作为特征的。前者对于旋转很敏感。后者对于轮廓线不封闭的字符图象不适用，因此很

难用于笔划断裂的字符的识别。

(6)笔划密度特征。笔划密度的描述有许多种，这里采用如下定义：字符图象某一特定范围的笔划密度是在该范围内，以固定扫描次数沿水平、垂直或对角线方向扫描时的穿透次数。这种特征描述了汉字的各部分笔划的疏密程度，提供了比较完整的信息。在图象质量可以保证的情况下，这种特征相当稳定。在脱机手写体的识别中也经常用到这种特征。但是在字符内部笔划粘连时误差较大。

(7)外围特征。汉字的轮廓包含了丰富的特征，即使在字符内部笔划粘连的情况下，轮廓部分的信息也还是比较完整的。这种特征非常适合于作为粗分类的特征。

调查问卷 (8)基于微结构特征的方法。这种方法的出发点在于，汉字是由笔划组成的，而笔划是由一定方向，一定位置关系与长宽比的矩形段组成的。这些矩形段则称为微结构。利用微结构及微结构之间的关系组成的特征对汉字进行识别，尤其是对于多体汉字的识别，获得了良好的效果。其不足之处是，在内部笔划粘连时，微结构的提取会遇到困难。

(9)特征点特征。早在1957年，Solatron Electronics Group公司发布了第一个利用窥视孔(p

eephole)方法的OCR系统。其主要思想是利用字符点阵中一些有代表性的黑点(笔划)，白点(背景)作为特征来区分不同的字符。后有人又将这种方法运用到汉字识别中，对其中的黑点又增加了属性的描述，如端点、折点、交叉点等。也获得了比较好的效果。其特点是对于内部笔划粘连的字符的识别的适应性较强，直观性好，但是不易表示为矢量形式，不适合作为粗分类的特征，匹配难度大。

3.统计识别与结构识别的结合

被控制感(1)网格化特征：

字符图象被均匀地或非均匀地划分为若干区域，称之为“网格”。在每一个网格内寻找各种特征，如笔划点与背景点的比例，交叉点、笔划端点的个数，细化后的笔划的长度、网格部分的笔划密度等等。特征的统计以网格为单位，即使个别点的统计有误差也不会造成大的影响，增强了特征的抗干扰性。这种方法正得到日益广泛的应用。

(2)人工神经网络

人工神经网络(Artificial Neural Network，以下称ANN)是一种模拟人脑神经元细胞的网络结

构，它是由大量简单的基本元件－神经元相互连接成的自适应非线性动态系统。虽然目前对于人脑神经元的研究还很不完善，我们无法确定ANN的工作方式是否与人脑神经元的运作方式相同，但是ANN正在吸引着越来越多的注意力。

二、方法归纳

1.模板匹配

优点，适应大部分识别，算法简单

缺点，不具有旋转不变性、不具有尺度不变性，且运算量较大，速度慢。

移动互联网概念股常用的相似度计算方法：

1.平方差；2.互相关；3.相关系数；4.上述三种方法的归一化形式。Opencv实现方式：matchTemplate(src,template,result,method)

CV_TM_SQDIFF平方差匹配法：该方法采用平方差来进行匹配；最好的匹配值为0；匹配越差，匹配值越大。

CV_TM_CCORR相关匹配法：该方法采用乘法操作；数值越大表明匹配程度越好。

CV_TM_CCOEFF相关系数匹配法：1表示完美的匹配；-1表示最差的匹配。

CV_TM_SQDIFF_NORMED归一化平方差匹配法

CV_TM_CCORR_NORMED归一化相关匹配法

CV_TM_CCOEFF_NORMED归一化相关系数匹配法

调试心得：模版匹配对于特征的识别不明显，对于极小的图像，不管用哪种相似度计算方法，都无法获得较好的识别效果，这是因为小的图像由于像素较少，导致相关性被极大缩小，这对于模板匹配的识别效果产生很大的影响。

2.K-L变换特征提取识别鸡汤怎么炖好喝又营养

K-L变换特征识别也叫做主成份分析识别，即PCA识别，是一种通过特征的线性组合来实现降维的方法。

设X=(X1，X2，…，XN)T为N维随机矢量，mX=E(X)和CX=E{(X－mX)(X－mX)T}分别为其平均值向量和协方差矩阵，ei和λi 分别为CX的特征向量和对应的特征值，其中i=1，…，N，并设特征值已按降序排列，即λ1≥λ2≥…≥λN，则K-L变换式为：

Y=A(X-mx) (1.1)

其中变换矩阵A的行为CX的特征值，即：

式中：eij表示第i个特征向量的第j个分量。 ①Y的均值向量为零向量0。即：

厂房拆除mY=E{Y} =E{A(X-mX)}=0 (1.2)

怎么种绿豆②K-L变换使矢量信号各分量不相关，即变换域信号的协方差为对角矩阵。

③K-L反变换式为：

X=A-1Y+mX=ATY+mx (1.3)

④K-L变换是在均方误差准则下失真最小的一种变换，故又称作最佳变换。

在K-L变换下，最小均方误差值等于变换域中矢量信号的最小的N－n个方差的和。特别有意义的是，如果这些分量的均值为零，则在恢复时只要把这些分量置零，便可以使均方误差最小。 K-L变换是一维变换，在对图像信号进行变换时，矢量可以是一幅图像或一幅图像中的子图像。矢量各分量之间的相关性反映了像素之间的相关性。

经过实验测试，如果在多个样本训练的前提下，可以得到较好的识别效果，识别成功率高于模板匹配。

本文发布于:2023-06-15 02:22:43，感谢您对本站的认可！

本文链接：https://www.wtabcd.cn/fanwen/fan/89/1038950.html

上一篇：基于LSTM-CRF的中医医案症状命名实体抽取研究

下一篇：【超详细】一文带你了解RNN家族知识点

标签：特征识别字符笔划变换

留言与评论（共有 0 条评论）