asysbang

标题: text2img [打印本页]

作者: admin    时间: 2019-9-5 17:13
标题: text2img
将文字转化成图片,这个对于生成训练数据有很大的作用
尤其是tesseract 4.0

text2image --find_fonts --fonts_dir ~/.fonts --text training_text.txt --min_coverage .9  --outputbase result --render_per_font=false

这里用的是~/.fonts目录下自己新添加的手写字体
Total chars = 767
Font Monaco failed with 10 hits = 1.30%
laowu Medium : 767 hits = 100.00%, raw = 362 = 100.00%

一定要看到raw这样的才是可以使用的字体

!!!生成tif时,一定不要加“--find_fonts”这个参数,否则上面会有说明的字符串,并且不能生成box文件
text2image  --fonts_dir ~/.fonts --text training_text.txt --min_coverage .9  --font "laowu Medium" --outputbase result
成功的话会生成tif和对应的box文件,可以用jtessBoxeditor查看






欢迎光临 asysbang (http://asysbang.com/) Powered by Discuz! X2.5