-
2018年搜狐内容识别算法大赛第四名解决方案:Sohu-2018-4th-place-solution
资源介绍
搜狐-2018年第四名
2018搜狐内容识别算法大赛
概述
前处理
HTML过滤器
分割
额外功能
数据扩充
任务1:标签分类
EDA
Word_tfidf
字符_tfidf
Word2vec
楷模
NBSVM
LGBM
TextCNN
神经网络
双LSTM
双GRU
合奏
Word2vec尺寸
嵌入层
01-2 0-1分类
任务2:文本提取
关键字词
提取文字
任务3:图像分类
文字识别
文字分类
区域过滤(CTPN)
在我的博客中查看更多详细信息
- 上一篇: 单片机万年历设计
- 下一篇: EDA课程设计(电子设计自动化)