-
Chinese-Text NER采用NLP技术,结合硬BiLSTM和CRF模型
资源介绍
NER:Keras中的中文命名实体识别
模型1:基于字符嵌入的BiLSTM-CRF。 Model2:在model1的基础上。 使用Conv1D从单词嵌入中提取n_gram特征作为辅助特征。
ps: 首先运行preprocess.py和utils.py,以获取已处理的train / dev / test数据和预训练的char / word嵌入矩阵。 文件“ appendix_···.py”是通过“ BosonNLP”写入的。
参考: 1,通过双向LSTM-CNNs-CRF进行端到端序列标记马学哲,爱德华·霍维(Eduard Hovy) 2.用于序列标记的双向LSTM-CRF模型。 黄志恒,徐伟,于凯。 3用于命名实体识别的神经体系结构Guillaume Lample等。