-
在Python中,利用BERT、LDA和TF-IDF进行关键字提取
资源介绍
Python中基于BERT,LDA和TFIDF的关键字提取
跳到: •••
kwx是用于基于Google的和多语言关键字提取的工具包。 该软件包提供了一套方法来处理不同语言的文本,然后从创建的语料库中提取和分析关键字(有关各种语言支持,请参阅 )。 唯一的重点是允许用户确定输出中不包括哪些单词,从而允许他们使用自己的直觉来微调建模过程。
有关该过程和技术的全面概述,请参阅,并参考以获取有关模型和可视化方法的说明。
通过PyPi安装
kwx可以通过pip从pypi下载或直接从此存储库中获取:
pip install kwx
git clone https://github.com/andrewtavis/kwx.git
cd kwx
python setup.py install
import kwx
型号
实现的NLP建模方法包括:
伯特
表示法是基于在开源Wikipedia数据上