-
CausalBank数据集来源于我们2020年IJCAI论文“因果的指导生成”
资源介绍
因果银行
在我们的IJCAI 2020论文“因果制导”中,我们发布了两个因果资源:
CausalBank:一个非常大规模的,开放域,句子级,平行的因果语料库。 根据句子中因果顺序的不同,它分为两个部分:因为_mode(效果,然后是原因)和因此_mode(原因,然后是效果)。 该语料库在我们的论文中用于训练seq2seq因果生成模型,请参阅该论文和我们的以供参考。
原因结果图:因果关系中的词汇原因结果图,具有频率。 该语料库是对的改进,并在我们的论文中用于查找引导的因果关键字。
这两种资源都是使用经过预处理的的细粒度因果模板匹配获得的,完全自动进行,没有任何人工注释。 里面或多或少有噪音。 因此,请根据您的研究案例进行调整。
在我们的假设中,上述因果资源可能会有益于诸如以下方面的未来研究:构建因果事件图,因果关系提取,情感因果发现,训练神经因果生成模型,可解释的文本推论,诸如Cosm
- 上一篇: Multilingual-Parallel-Corpus:多语言平行语料库及文本预处理工具
- 下一篇:没有了