-
在2017年CCF大数据与计算智能大赛中,蚂蚁金服商铺定位赛题荣获全国第5名的优异成绩,命名为Ant_Tianchi_CCF_Positioning
资源介绍
Ant_Tianchi_CCF_Positioning
2017CCF大数据与计算智能大赛-蚂蚁金服-商铺定位赛题(第5名)
赛题链接
文件说明
getFeatures.sql为二分类部分预处理与得到特征中间文件处理,之后再在PAI平台上搭建组件让每个特征文件和构建的样本join起来,多分类部分由队友负责
wifiFingerprint.ipynb为初赛的python版构建指纹库及计算指纹得分,复赛java实现在udtf中
udtf为getFeatures用到的几个udtf方法
xgb_train.sql为PAI平台的xgboost命令(平台没有xgboost的拖拽组件,只能用PAI命令)
submission.sql为提交结果部分,包括最佳成绩的加权平均
训练说明:
7.1-8.17做8.18-8.31统计区间,7.15-8.31做9.1-9.14测试集的统计区间
复赛有约38%的数据没