-
IJCAI-18:阿里妈妈广告搜索转化率预测项目在round1中获得Rank 58的成绩
资源介绍
IJCAI-18 阿里妈妈搜索广告转化率预测
队名:进复赛就开源
成绩:round1 Rank 58/5204,round2 112/5204
文件说明
main.py: 主函数,包括特征提取与函数定义。
EDA_visual.py: 数据可视化分析文件
Bayes code: 贝叶斯平滑代码,这个可进行预处理保存为文件,可节省时间。
数据分析
主要包括数据分布分析,训练数据与测试数据的区别,以及对数据去重,填补空缺值等操作。通过对数据可视化处理,分析出特征与转化率之间的关系,有利于后续对特征的提取。
主要特征
点击次数\个数统计特征:
原始特征主要包括用户信息,广告商品信息,上下文信息以及店铺信息。根据经验,首先对重要特征统计次数以及两两之间互相组合,主要包括:用户与商品组合,商品与商店组合,用户与商店组合以及它们之间内部的组合。这里主要用到的工具是pandas中的g
- 上一篇: LR预测CTR数据集data.zip
- 下一篇: 推荐系统数据全集