登录 注册
当前位置:主页 > 资源下载 > 50 > PTB文本数据集是指Penn Tree Bank

PTB文本数据集是指Penn Tree Bank

  • 更新:2024-09-14 23:30:56
  • 大小:93.28MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:深度学习 - 人工智能
  • 格式:TAR

资源介绍

来源于 Tomas Mikolov 网站上的 PTB 数据集http://www.fit.vutbr.cz/~imikolov/rnnlm/simple-examples.tgz。 该数据集已经预先处理过并且包含了全部的 10000 个不同的词语,其中包括语句结束标记符,以及标记稀有词语的特殊符号 () 。我们在 reader.py 中转换所有的词语,让他们各自有唯一的整型标识符,便于神经网络处理。