-
pip install nlpcda:一键实现NLP和BERT数据增强,涵盖EDA等功能的中文数据增强包
资源介绍
NLP中文数据增强一键中文数据增强工具
使用: pip install nlpcda
开源不易,欢迎star :glowing_star:
pypi: ://pypi.org/project/nlpcda/
介绍
一键中文数据增强工具,支持:
经过细节特殊处理,比如不改变年月日数字,尽量保证不改变原文语义。即使改变也能被猜出来、能被猜出来、能被踩出来、能被菜粗来、被菜粗、能菜粗来
计划中的未来内容
增加多线程操作,一键操作
随机噪声注入?随机插入一些字符,太简单实现了。
利用pingyin?
基于Word2Vec,BERT等词向量的词组近距离的替换,MASK替换替换??但是无法控制它生成,以及缺点MASK位置。
- 上一篇: awesome-data-augmentation:这是关于数据扩充的很棒方法的列表
- 下一篇:没有了