登录 注册
当前位置:主页 > 资源下载 > 7 > 与“利用预训练的变压器模型进行数据增强”相关的TransformersDataAugmentation代码

与“利用预训练的变压器模型进行数据增强”相关的TransformersDataAugmentation代码

  • 更新:2024-12-11 18:58:56
  • 大小:859KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据集 - 行业研究
  • 格式:ZIP

资源介绍

使用预训练的变压器模型进行数据增强 该代码最初是从Amazon-research软件包( )发布的。在本文中,我们提到了网址,因此在此处提供相同代码的副本。 与相关的代码论文 代码包含以下数据扩充方法的实现 EDA(基准) 回译(基准) CBERT(基准) BERT Prepend(我们的论文) GPT-2前置(我们的论文) BART前置(我们的论文) 数据集 在本文中,我们使用以下资源中的三个数据集 STSA-2: : TREC: : SNIPS: : 低数据状态实验设置 运行src/utils/download_and_prepare_datasets.sh文件以准备所有数据集。 download_and_prepare_datasets.sh执行以下步骤 从github下载数据 用STSA-2和TREC数据集的文本替换数字标签 对于给定的数据集,创建Tra