-
人民日报于1998年1月发布的中文标注语料库
资源介绍
人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。该语料库对600多万字节的中文文章进行了分词及词性标注,其被作为原始数据应用于大量的研究和论文中。
- 上一篇: Python-中文自然语言处理数据集
- 下一篇: 中文命名实体识别ner数据_resume_bio格式