--
使用jTessBoxEditorFX训练Tesract-OCR教程
步骤一:使用画图软件生成要训练的.tif文件,本例做了34个.tif文件,如下:
步骤二:使用jTessBoxEditorFX将所有.tif文件合并成一个.tif文件,如图:
--
--
并在该目录下可以看见合并后你所命名的tif文件。如图:
--
--
步骤三:打开cmd窗口,将目录切换到安装的tesseract目录下,输入以下命令,生成b
ox文件,如图:
tesseract ZG.SFJC.exp0.tif 0 -psm 7 -l chi_sim bp mak
ebox
注:l是L的小写。 白色蕾丝裙
--
--
并在该目录下会生成ZG.SFJC.exp0.box文件,如图:
步骤四咖啡哪个牌子最好 :使用jTessBoxEditorFX工具选择Box Editor-Open,打开tif文件(此时同名的
tif、box文件必须同处一个目录下烧烤食品 ,我都给他放在tesseract安装目录下了),如下图:
查看所有文件并校正错误的文件,如图:
--
--
双击红色箭头处,将其修改为台,并单击character 后的后,单击save。校正完毕
t删去。如图所示:
后,在该目录下新建一个TXT文件将其文件名改为font_properties,并将其文件扩展名.tx
打开font_properties文件,并在其中输入[fontname] 0 0 0 0 0,如下图所示。
注:[fontname]:面包的英文 即是.exp0中的SFJC
步骤五:使用修正后的box文件来训练,在cmd中运行一下语句:
tesract ZG.SFJC.exp0 -psm 7 nobatch box.train
后会在该目录下生成一个文件。如图:
--
--
步骤六:提取字符,运行如下命令:
unicharset_extractor ZG.SFJC.exp0.box
后会在该目录下生成一个名为unichart文件,如图所示:
步骤七:生成特征1,运行如下语句:
shapeclustering -F font_properties -U unicharset ZG.SFJC.exp
--
--
后会在该目录下生成一个shapetable和pffmtable文件,如图所示:
步骤八:生成特征2,运行如下语句:
mftraining -F font_properties -U unichart -O unichart ZG.SFJC.e
x
后会生成一个名为inttemp文件安全教育手抄报 ,如图氨茶碱片的副作用 所示:
步骤九:生成特征3,运行如下语句:
--
--
cntraining ZG.SFJC.exp0.tr
后会生成一个名为normproto文件,如下图:
步骤十:将以上生成的五个文件重命名,即在前面加上SFJC.(即font_properties文件中
的[fontname],别忘了.) 如图所示:
后运行如下语句:(输入时别忘了SFJC后的.)
combine_tessdata SFJC.
这时会生成名为SFJC.traineddata的文件,如图所示:
--
--
接下来就是将SFJC.traineddata复制到安装tesseract目录下的tessdata文件夹下。六国破灭
运行如下语句测试:
tesseract 1.tif out -l SFJC
结果如下:
--
本文发布于:2023-04-27 13:02:43,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/fanwen/fan/82/517398.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |