《应用汉字识别》课件

更新时间:2022-09-30 06:54:24 阅读: 评论:0

《应用汉字识别》PPT课件
《应用汉字识别》PPT课件
1、文字识别问题
1)汉字识别
2)汉字OCR技术发展历史
3)国内主要研究机构
1、文字识别问题1)汉字识别
1)汉字识别
汉字识别属于文字识别(OCR)的范畴,文字识别是模式识别的重要应用领域。汉字识别技术涉及到模式识别、图像处理、人工智能、模糊数学、组合论、信息论、计算机等多个学科,也涉及到语言文字学、心理学等学科,是一门综合性的技术。
1)汉字识别汉字识别属于文字识别(OCR)的范畴,文字识别
根据应用情况的不同汉字识别具体又分为印刷体汉字识别和手写体汉字识别。
手写体汉字识别又分为两种:在线手写体识别和离线手写体识别。
本章主要讨论印刷体汉字识别问题…
根据应用情况的不同汉字识别具体又分为印刷体汉字识别和手写体汉
印刷体汉字识别,从识别字体上可分为单体(一般为宋体)印刷汉字识别和多媒体汉字识别;从识别文字品质上可分为高品质印刷汉字识别和低品质印刷汉字识别;从应用范围上可分为专用印刷汉字识别和通用印刷汉字识别。
印刷体汉字识别,从识别字体上可分为单体(一般为宋体)印刷汉字
汉字识别难度
印刷体识别
最容易
已经有了大量实际应用,图书馆数字化
脱机手写体识别——最难
脱机手写体数字的识别已有实际应用外,比如邮政编码的自动识别
汉字等文字的脱机手写体识别还处在实验室阶段
联机手写体识别
相对容易,PDA等的推广,大量应用
汉字识别难度印刷体识别脱机手写体识别——最难联机手写体识别
不同字体的同一汉字的结构约80%相同,但书写风格,笔划粗细形状,笔划装饰等有一定的差异。不同印刷体汉字字形差别主要有:
(1)笔划装饰及方向角度不同。
(2)笔划长短、位置有变化。
(3)笔划形态变化:如黑体笔划粗而平直,宽度一致;宋体横细竖粗,有装饰角;楷体笔划有较大曲率,其中撇、捺弯曲程度更大,各个文字大小相差较大;仿宋体横笔划略向上倾斜。
不同字体的同一汉字的结构约80%相同,但书写风格,笔划粗细形
(4)笔划关系变化:如左偏旁口,黑体为正方形,其他体左竖笔较长。
(5)偏旁部首占方块字的比例、位置、形态方面,不同字体也有差异。
(4)笔划关系变化:如左偏旁口,黑体为正方形,其他体左竖笔较
2)汉字OCR技术发展历史
西文OCR技术研究始于50年代
OpticalCharacterRecognition(OCR)
几乎所有的早期模式识别研究者都进行过字符识别的研究。随后的30多年来,字符识别一直是模式识别的重要内容之一
汉字OCR技术
印刷体汉字的识别最早可以追溯到60年代
1966年,IBM公司的Cay和Nagy发表了第一篇关于印刷体汉字识别的论文,在这篇论文中他们利用简单的模板匹配法识别了1,000个印刷体汉字
2)汉字OCR技术发展历史西文OCR技术研究始于50年代汉字
2)汉字OCR技术发展历史
70年代以来,日本人做了许多工作
日本的常用汉字有2000个左右
1977年东芝综合研究所研制了可以识别2000个汉字的单体印刷汉字识别系统
80年代初期,日本武藏野电气研究所研制的可以识别2300个多体汉字的印刷体汉字识别系统,代表了当时汉字识别的最高水平
日本的三洋、松下、理光和富士等公司也有其研制的印刷汉字识别系统
简评
这些系统在方法上,大都采用基于KL数字变换的匹配方案,使用了大量专用硬件,其设备有的相当于小型机甚至大型机,价格极其昂贵,没有得到广泛应用
2)汉字OCR技术发展历史70年代以来,日本人做了许多工作

本文发布于:2022-09-30 06:54:24,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/fanwen/fan/78/202525.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:汉字   课件
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图