-
我们提供的源代码是为了解决Recsys-Spotify-2018挑战而设计的
资源介绍
我们针对RecSys 2018挑战赛的代码(最终排行榜第六名)
该存储库包含我们针对RecSys 2018挑战的解决方案的Python源代码。
资料准备
为了将我们提交的内容复制到RecSys 2018挑战赛,您首先需要从赛下载百万播放列表数据集和挑战赛集。 这两个数据集分别记录为JSON文件和压缩为mpd.v1.tgz和challenge.v1.tgz 。 下载完这些文件后,请解压缩它们,然后将解压缩的文件放在一个名为src/data/的新文件夹中。 如果操作正确,则应将“百万播放列表”数据集的JSON文件存储在子文件夹src/data/mpd.v1/data/ ,并将挑战集的JSON文件存储在子文件夹src/data/challenge.v1/ 。
代码结构
数据预处理。 大量的JSON文件对于下游数据操作来说比较麻烦,因此我们首先将它们处理为几个CSV文件,使用的脚本存储在src/