-
Tesseract OCR能够识别图片中的文字,支持包含中文在内的语言包
资源介绍
安装 中文包 支持
https://blog.****.net/u012476249/article/details/53307160
在chi_sim.traineddata(注意版本)文件目录下(../Tesseract-OCR/tessdata),使用命令行执行:
combine_tessdata -e chi_sim.traineddata chi_sim.config
执行完后,在目录下出现chi_sim.config的文件,打开该文件;
在allow_blob_division F这一行的前面加#,注释掉
即:# allow_blob_division F
然后,在执行命令行:
combine_tessdata -o chi_sim.traineddata chi_sim.config