-
seq2seq-layout-analysis:运用send2seq的端到端布局分析方法
资源介绍
票据类版面分析算法
当前OCR之后的版本面分析工作大家都是规则编写的,本人也遭受规则之苦,看到ocr输出的一大堆文字和坐标就头皮发麻。一个基于seq2seq的端到端版面分析算法,希望能够帮到各位ocrer。
思路:通过有监督方式训练句向量,然后通过seq2seq的方式学习box类别
链接: :
使用方法
准备数据
首先利用自己的OCR算法,将票据图片文字识别出来
将结果存入labelme临时json
使用labelme在groupid里标注所需要提取的box类别
将标注数据放入数据对应的train和test文件夹下
数据样例参考data / train / 1.json
修改config.py其中5个参数,其余可根据情况调试
self.class_char # 标签列表(对应groupid)
self.max_text_len = 20 #