-
Multimodal-Toolkit利用HuggingFace的变压器作为构建文本和表格数据多模态模型的文本数据组件
资源介绍
多峰变压器| 带有表格数据的变压器
| |
一个工具包,用于将多模式数据合并到文本数据之上,以进行分类和回归任务。 它使用HuggingFace变压器作为文本特征的基本模型。 该工具包增加了一个合并模块,除了分类和数字功能外,该模块还获取变压器的输出,以为下游的分类/回归层生成丰富的多峰特征。 给定一个经过预训练的变压器,将根据监督任务对组合模块和变压器的参数进行训练。 对于简短的文献回顾,请查看佐治亚州的影响力博客上随附的。
安装
该代码是在Python 3.7中使用PyTorch和转换器3.1开发的。 多模式特定代码位于multimodal_transformers文件夹中。
pip install multimodal-transformers
支持的变形金刚
支持以下Hugging Face Transformers处理表格数据。 请参阅的文档。
从Devlin等: (AC