拍拍贷“魔镜风控系统”从平均400个数据维度评估用户当前的信用状态,给每个借款人打出当前状态的信用分,在此基础上,再结合新发标的信息,打出对于每个标的6个月内逾期率的预测,为投资人提供了关键的决策依据,促进健康高效的互联网金融。拍拍贷首次开放丰富而真实的历史数据,邀你PK“魔镜风控系统”,通过机器学习技术,你能设计出更具预测准确率和计算性能的违约预测算法吗?
参赛团队需要基于训练集数据构建预测模型,使用模型计算测试集的评分(评分数值越高,表示越有可能出现贷款违约)。
2月25日-3月31日 组建参赛团队并报名,于截止日期前提交初赛作品方案。选手可以于3月15日开始提交预测结果,并得到AUC数值反馈。
4月1日-4月7日 评委进行在线评审,选出各个赛题的前100名进入复赛,并提供评分反馈帮助选手完善作品。
4月8日-4月18日 复赛团队进一步完善作品,于截止日期前提交复赛作品方案。
4月19日-4月23日 评委进行在线评审,选出各个赛题的前6名进入决赛。
5月15日 三个赛题共18支决赛团队进行项目路演,评委现场打分并颁出奖项。
对于魔镜杯三个分赛题中最优秀的金奖团队,额外奖励10万元现金
10万元现金 一支团队
5万元现金 一支团队
1万元现金 两支团队
本次大赛将公开国内网络借贷行业的贷款风险数据,包括信用违约标签(因变量)、建模所需的基础与加工字段(自变量)、相关用户的网络行为原始数据。本着保护借款人隐私以及拍拍贷知识产权的目的,数据字段已经过脱敏处理。
数据编码为GBK。初赛数据包括3万条训练集和2万条测试集。复赛会增加新的3万条数据,供参赛团队优化模型,并新增1万条数据作为测试集。所有训练集,测试集都包括3个csv文件。
每一行代表一个样本(一笔成功成交借款),每个样本包含200多个各类字段。
idx:每一笔贷款的unique key,可以与另外2个文件里的idx相匹配。
UserInfo_*:借款人特征字段
WeblogInfo_*:Info网络行为字段
Education_Info*:学历学籍字段
ThirdParty_Info_PeriodN_*:第三方数据时间段N字段
SocialNetwork_*:社交网络字段
LinstingInfo:借款成交时间
Target:违约标签(1 = 贷款违约,0 = 正常还款)。测试集里不包含target字段。
借款人的登陆信息。
ListingInfo:借款成交时间
LogInfo1:操作代码
LogInfo2:操作类别
LogInfo3:登陆时间
idx:每一笔贷款的unique key
借款人修改信息
ListingInfo1:借款成交时间
UserupdateInfo1:修改内容
UserupdateInfo2:修改时间
idx:每一笔贷款的unique key