{"list":[{"imgUrl":"https://file7info.ppdai.com/b2108ae1310245988a700202e57ae7a2.jpg","matchName":"第三届魔镜杯大赛","bonusAmount":650000.0,"matchDesc":"

人工智能的时代已悄然来临,无论你是自然语言处理高手还是文本挖掘领域的大拿,无论你是深居忘我的技术咖还是满怀激情的产品控,在“魔镜杯”都可以一展拳脚。

“魔镜杯”赛事已连续举办了两届,第三届也如期而至。在前两届风控算法大赛和数据应用大赛之后,本届赛事将是一场与未来的对话,挑战你的算法实力!拍拍贷此次提供智能客服聊天机器人真实数据,以自然语言处理和文本挖掘技术为主要探索对象。我们邀请优秀的你,利用这些资源开发一种算法,提高智能客服的识别能力和服务质量。

智能客服聊天机器人场景中,待客户提出问题后,往往需要先计算客户提出问题知识库问题的相似度,进而定位最相似问题,再对问题给出答案。本次比赛的题目便是问题相似度算法设计。


赛制介绍

本次比赛分为三个阶段:初赛、复赛、决赛

初赛:北京时间 2018/06/10 00:00:00 - 2018/07/09 23:59:59, 30天

初赛阶段比赛开放报名,开放组队。参赛队伍经过实名认证之后可通过比赛平台下载数据,本地调试算法,在线提交结果。每队每天可以提交5次结果,以30%测试数据量的计算得分排名,并以每队最优成绩排名,排行榜实时显示最新结果。

复赛:北京时间2018/07/10 00:00:00 - 2018/07/16 23:59:59, 7天

初赛排行榜前30%团队进入复赛。复赛期间关闭报名,关闭组队。参赛队伍通过比赛平台下载数据,本地调试算法,在线提交结果。每队每天可以提交1次结果,以全部测试数据量的计算得分排名,并以每队最优成绩排名,排行榜实时显示最新结果。

决赛:北京时间2018/07/24, 1天

决赛将以现场答辩会的形式进行,邀请复赛排名前十的队伍进行现场答辩,晋级决赛团队需提前准备答辩材料,包括答辩PPT、参赛总结、算法核心代码。决赛评委会综合考虑客观成绩和现场答辩给出最终名次。

参赛对象:

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方员工参赛,可参与排名,但不参与评奖及领取奖金。

比赛作品说明:

参赛作品的知识产权归参赛作者所有。组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整。

组委会权责说明:

主办方享有优先购买参赛选手优秀作品的权利。

组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现不可控因素,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制:

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

指导单位:

联合主办方:

合作院校:

加群交流:

比赛选手交流官方QQ群:716424192

","memberCount":942,"teamCount":576,"startTime":"2018-06-10 00:00:00","id":1,"endTime":"2018-07-24 23:59:59","introduction":"第三届“魔镜杯”由拍拍贷智慧金融研究院主办,在2018年6月10日至7月24日举行,总奖池高达10万美金。拍拍贷将提供智能客服聊天机器人真实数据,以自然语言处理和文本挖掘技术为主要探索对象。我们邀请优秀的你,利用这些资源开发一种算法,提高智能客服的识别能力和服务质量。Come on!秀出你的算法实力!"},{"imgUrl":"https://aifile.ppdai.com/c4027b9bfd994a52871a33362147946c..png","matchName":"第四届魔镜杯大赛","bonusAmount":370000.0,"matchDesc":"

赛题背景

资金流动性管理迄今仍是金融领域的经典问题。在互联网金融信贷业务中,单个资产标的金额小且复杂多样,对于拥有大量出借资金的金融机构或散户而言,资金管理压力巨大,精准地预测出借资金的流动情况变得尤为重要。本次比赛以互联网金融信贷业务为背景,以《现金流预测》为题,希望选手能够利用我们提供的数据,精准地预测资产组合在未来一段时间内每日的回款金额。

本赛题涵盖了信贷违约预测、现金流预测等金融领域常见问题,同时又是复杂的时序问题和多目标预测问题。希望参赛者利用聪明才智把互联网金融的数据优势转化为行业解决方案。

详细的赛题背景、赛题相关名词以及其他问题,请参见“FAQ”板块。

赛制介绍

即日起至初赛结束均可报名参赛,以下是重要事件及时间。

初赛:北京时间 2019/06/05 00:00:00 - 2019/07/04 23:59:59,30天

已报名参赛的队伍经过实名认证之后可通过比赛平台下载数据。参赛队伍本地调试算法,在线提交结果。每队每天可提交5次结果,以30%测试数据量计算得分,以每队最优成绩排名,实时显示最新结果。

复赛:北京时间 2019/07/05 01:00:00 - 2019/07/10 23:59:59, 6天

初赛排行榜前30%团队进入复赛。复赛期间关闭报名,关闭组队。每队每天提交1次结果,以全部测试数据量计算得分以每队最优成绩排名,实时显示最新结果。

决赛:北京时间 2019/07/21, 1天

决赛将以现场答辩会的形式进行,邀请复赛排名前十的队伍进行现场答辩,晋级决赛团队需提前准备答辩材料,包括答辩PPT、参赛总结、算法核心代码。决赛评委会综合考虑客观成绩和现场答辩给出最终名次。

参赛对象:

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方员工参赛,可参与排名,但不参与评奖及领取奖金。


比赛作品说明:

在大赛过程中用户开发的结果数据及数据报告等成果的知识产权及一切权利均属于拍拍贷;

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整。

组委会权责说明:

组委会保留对比赛规则进行调整修改的权利。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现不可控因素,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制:

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

获奖队伍名单:

经过初赛、复赛、决赛,以下队伍脱颖而出:

加群交流:

比赛选手交流官方QQ群:716424192

","memberCount":1939,"teamCount":1215,"startTime":"2019-06-05 00:00:00","id":17,"endTime":"2019-07-21 23:59:59","introduction":"在互联网金融信贷业务中,单个资产标的金额小且复杂多样,给出借人或机构带来巨大的资金管理压力。参赛选手需要利用提供的数据,预测资产组合在未来一段时间内每日的回款金额。"},{"imgUrl":"https://aifile.ppdai.com/911c9d506664471e97ec0acf04840ba8..png","matchName":"第五届信也科技杯数据解决方案应用大赛","bonusAmount":300000.0,"matchDesc":"

赛题背景

小微企业是国民经济的重要组成部分。据公开资料显示,截至2017年末,我国小微企业法人约有2800万户,个体工商户约6200万户,中小微企业(含个体工商户)占全部市场主体的比重超过90%,贡献了全国80%以上的就业,70%以上的发明专利,60%以上的GDP和50%以上的税收。作为中国经济的毛细血管,国家出台了一系列政策扶植小微企业。但由于其资质的特殊性,小微企业融资难、融资渠道单一,是我国乃至世界其他国家的通病。

本届信也科技杯以小微企业信贷为主题,面向大众征集信贷领域的技术解决方案。以评选参赛者的方案为比赛形式,通过专家学者、企事业专家、权威媒体对参赛选手的项目进行综合评比的方式,评出优胜者。我们邀请各位选手群策群力,探讨如何通过技术赋能、完善多元化的小微信贷体系。

赛题说明

小微企业授信业务复杂,风险评估成本高,信审周期相对长,企业和金融机构间信息不对称严重。我们邀请优秀的你,运用金融科技的力量,改进甚至重构小微信贷流程,包括但不局限于以下具体问题:

参赛选手,可以从上述或其他小微信贷领域的具体问题中选择1至2个进行深入探讨、并给出创意方案。

初赛阶段要求参赛团队提交创意解决方案,可提供作品原型及原型文档进行补充说明。创意方案说明以PPT形式呈现(PPT模版可参考“参数模板下载”中的文件)。所有素材包括但不限于文字、图片、视频等均需为中文。作品原型的形式包括但不限于技术代码、原型、移动应用、网站、可视化等形式,提交时提交指向原型下载地址或测试地址的网络链接。请各团队将创意方案、作品原型、代码等所有材料,以zip格式压缩在一个文件内,zip文件命名格式为“团队名+提交日期.zip”,例如“参赛队伍A+20200701.zip”。

提交创意方案时请参考以下格式:

决赛阶段将邀请入围团队就方案进行说明演示,并接受嘉宾评委的提问和点评。

参赛团队

关于作品内容

① 提交的应用内容不完整,或提交任何虚假信息;

② 违背中华人民共和国相关法律法规;

③ 涉嫌作弊行为,侵犯他人知识产权;

④ 提交的作品包含不健康、淫秽、色情或诽谤任何第三方的内容;

⑤ 提交的作品包含其他赛事组委会认为不适当的内容。

","memberCount":290,"teamCount":146,"startTime":"2020-06-22 10:00:00","id":25,"endTime":"2020-08-30 23:59:59","introduction":"小微企业授信业务复杂,风险评估成本高,信审周期相对长,企业和金融机构间信息不对称严重。参赛队伍可使用金融科技的力量,通过公开数据来改善,甚至重构小微企业授信的流程。"},{"imgUrl":"https://aifile.ppdai.com/e56f9fd9111d479daca475d9a4d6b434..png","matchName":"第六届信也科技杯图像算法大赛——智能零售柜商品识别","bonusAmount":310000.0,"matchDesc":"

大赛概况

本届大赛为图像领域的数据算法竞赛,参赛前请详细阅读网站赛事说明和“操作手册”

选手关于赛事的问题组委会进行了一场答疑直播,可点击链接回放查看https://meeting.tencent.com/l/WM18voLMmZ7G (有效期至2021.07.03)

初赛评测阶段。报名组队成功后,选手可前往“参赛模板下载”区下载初赛数据(开放下载时间2021.5.24 12:00:00),本地调试算法,在线提交结果。以初赛评估集的打分结果计算得分排名,并以每队最优成绩排名,排行榜实时显示最新结果。

组委会将选取阶段一最终排名前50名或排名前30%(两者取最小值,不含内部参赛员工)的参赛队伍入围初赛阶段二(初赛复审);团队需要在线提交代码运行打分,组委会将结合线上打分和线下审核结果,识别人工标注的队伍,终止无实际算法贡献的团队参赛。

复赛提交流程和评审规则同初赛复审阶段,组委会依据复赛排名榜单结合线下评审选出前10支队伍晋级决赛(不含内部参赛人员及其加入小组)。

决赛将以远程答辩的形式进行,晋级决赛团队需提前准备答辩材料和录屏,答辩要求将另行邮件通知入围决赛队伍。

决赛当天将线上播放录屏和远程答辩,主办方会邀请权威评委对各选手的答辩内容做点评,并根据选手综合表现给出评分。最终会结合复赛客观成绩和现场答辩成绩加权平均后给出名次。

决赛具体时间将另行通知。


赛题描述

本次大赛的数据为静态智能零售货柜采集摆放商品后的零售柜内部图片,在此基础上进行人工标注给出了该次竞赛的数据集,数据集分为训练数据集、训练商品库、初赛评估集、初赛商品库、复赛评估集和复赛商品库,初赛及复赛中均可使用训练数据集、训练商品库。本竞赛的目标是检测出商品的外接矩形框且识别出商品的类别(通过从商品库中检索出最相似的商品信息来确定待识别的商品类别)

以下为静态柜内部商品摆放图和各商品的标注框


以下为商品库中单个商品的摆放样例图


因训练数据集、初赛评估集及复赛评估集中包含的图片都包含多个商品实例,该类图片称为密集商品图片;商品库中包含的任一图片只包含一个商品实例,该类图片称为稀疏商品图片。

初赛环节提供训练数据集、训练商品库、初赛评估集、初赛商品库供选手下载。

训练数据集包含图片数据及标注信息(标注信息详见“数据集下载”页面的数据集说明)。图片数据集为密集商品图片,格式为jpg。标注信息遵循COCO数据集的标注格式。

训练商品库包含了图片数据集及标注信息。图片数据集为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。标注信息遵循COCO数据集的标注格式。训练时,可依据训练数据中的商品实例类别id与商品库中商品实例类别id进行关联。

初赛评估集包含图片数据及注释文件。图片数据为密集商品图片,格式为jpg。因注释文件只包含图片名称与图片序号的映射关系,选手算法预测结果需遵循该映射关系。如图片中出现多个商品实例,每个商品可以任意顺序标注,评测时将被独立计算。

初赛商品库包含了图片数据集及标注信息。图片数据为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。标注信息遵循COCO数据集的标注格式。评估时,对于初赛评估集中给定商品实例,必须依据从初赛商品库中检索出来的最相似的商品列表及对应类别信息,给出给定商品实例的类别预测信息。

初赛阶段一与初赛阶段二共用初赛数据集。

复赛环节提供复赛评估集、复赛商品库,选手无法下载,只能提交推理文件并线上调用

此外,基于安全考虑,复审和复赛环节线上运行的代码不允许访问外网,需要从外网下载的文件比如初始模型权重等,请统一放到代码包内一起上传,由于网络访问禁用导致无法运行代码的情况由选手自行承担后果。

复赛评估集包含图片数据及注释文件。图片数据为密集商品图片,格式为jpg。在线打分时,图像数据位于给定文件夹中。注释文件只包含图片名称与图片id的映射关系,选手算法预测结果需遵循该映射关系。如图片中出现多个商品实例,每个商品可以任意顺序标注,评测时将被独立计算。

复赛商品库包含了图片数据集及标注信息。图片数据集为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。在线打分时,图像数据位于给定文件夹中。复赛商品库的作用为,对于复赛评估集中给定商品实例,必须依据从复赛商品库中检索出来的最相似的商品列表及对应类别信息,给出商品实例的类别预测信息。

本次比赛允许参赛选手使用其他公开数据集和公开模型,但参赛选手的模型必须满足能在限定时间内复现的要求,复现精度小于规定误差,并且需要注明使用的公开数据集、下载地址及公开模型。


算法设计

本次竞赛仅允许检测+检索的算法设计形式,下面的伪代码给出了一种可行的方式

算法工作伪代码(以二阶段检测算法+检索算法为例):

image = sequential_sampler(a_images) # 获取待预测图片
image_tensor = detector_image_preprocess(image) # 图片预处理
feature_maps = detector_backbone(image_tensor) # 获取特征图
ROIs = region_proposal(feature_maps) # 区域提议
for ROI in ROIs
patch = roi_align(feature_maps, ROI) # roi pooling
SKUs = detector_head(patch) # SKU外接框预测结果

for SKU in SKUs
SKU_image_tensor = searcher_image_preprocess(SKU) # 图片预处理
embedding = searcher_backbone(SKU_image_tensor) # 获取embedding
distance_matrix = calculate_distance(embedding, b_images) # 计算距离矩阵
most_similar_topK = select_topK(distance_matrix) # 选择最相近topk
category_id = get_prediction_result(most_similar_topK) # 输出类别结果


参赛说明

参赛对象

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方集团员工参赛(包括内部与外部选手组队),可参与排名,但不占用晋级名额,不参与评奖及领取奖金。

比赛作品说明

参赛作品的知识产权归参赛作者所有。组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整

组委会权责说明

主办方享有优先购买参赛选手优秀作品的权利。

组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现参赛团队作弊等违规情况,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

官方唯一交流QQ群:群号716424192

","memberCount":1036,"teamCount":509,"startTime":"2021-05-24 12:00:00","id":26,"endTime":"2021-08-16 23:59:59","introduction":"第六届信也科技杯图像算法大赛,于2021年5月22日至2021年8月期间举行,总奖池高达31万人民币。本届大赛以智能零售为场景,提供真实图片数据,探索智能零售领域的图像识别方案,从而让机器更精准地识别商品,通过更快捷地购物带来全新的客户体验。"},{"imgUrl":"https://aifile.ppdai.com/610209c807a34dc9bba780e87566602a..png","matchName":"第六届信也科技杯线上测试","bonusAmount":310000.0,"matchDesc":"

大赛概况

本届大赛为图像领域的数据算法竞赛,参赛前请详细阅读网站赛事说明和“操作手册”

初赛评测阶段。报名组队成功后,选手可前往“参赛模板下载”区下载初赛数据(开放下载时间2021.5.22 00:00:00),本地调试算法,在线提交结果。以初赛评估集的打分结果计算得分排名,并以每队最优成绩排名,排行榜实时显示最新结果。

组委会将选取阶段一最终排名前50名或排名前30%(两者取最小值,不含内部参赛员工)的参赛队伍入围初赛阶段二(初赛复审);团队需要在线提交代码运行打分,组委会将结合线上打分和线下审核结果,识别人工标注的队伍,终止无实际算法贡献的团队参赛。

复赛提交流程和评审规则同初赛复审阶段,组委会依据复赛排名榜单结合线下评审选出前10支队伍晋级决赛(不含内部参赛人员及其加入小组)。

决赛将以现场答辩的形式进行,晋级决赛团队需提前准备答辩材料,答辩要求将另行邮件通知入围决赛队伍。

决赛当天将在线下进行答辩,主办方会邀请权威评委对各选手的答辩内容做点评,并根据选手综合表现给出评分。最终会结合复赛客观成绩和现场答辩成绩加权平均后给出名次。

决赛具体时间将另行通知。


赛题描述

本次大赛的数据为静态智能零售货柜采集摆放商品后的零售柜内部图片,在此基础上进行人工标注给出了该次竞赛的数据集,数据集分为训练数据集、训练商品库、初赛评估集、初赛商品库、复赛评估集和复赛商品库,初赛及复赛中均可使用训练数据集。本竞赛的目标是检测出商品的外接矩形框且识别出商品的类别(通过从商品库中检索出最相似的商品信息来确定待识别的商品类别)。

以下为静态柜内部商品摆放图和各商品的标注框

以下为商品库中单个商品的摆放样例图

因训练数据集、初赛评估集及复赛评估集中包含的图片都包含多个商品实例,该类图片称为密集商品图片;商品库中包含的任一图片只包含一个商品实例,该类图片称为稀疏商品图片。

初赛环节提供训练数据集、训练商品库、初赛评估集、初赛商品库供选手下载。

训练数据集包含图片数据及标注信息(标注信息详见“数据集下载”页面的数据集说明)。图片数据集为密集商品图片,格式为jpg。标注信息遵循COCO数据集的标注格式。

训练商品库包含了图片数据集及标注信息。图片数据集为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。标注信息遵循COCO数据集的标注格式。训练时,可依据训练数据中的商品实例类别id与商品库中商品实例类别id进行关联。

初赛评估集包含图片数据及注释文件。图片数据为密集商品图片,格式为jpg。因注释文件只包含图片名称与图片序号的映射关系,选手算法预测结果需遵循该映射关系。如图片中出现多个商品实例,每个商品可以任意顺序标注,评测时将被独立计算。

初赛商品库包含了图片数据集及标注信息。图片数据为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。标注信息遵循COCO数据集的标注格式。评估时,对于初赛评估集中给定商品实例,可以依据从商品库中检索出来的最相似的商品列表及对应类别信息,给出给定商品实例的类别预测信息。

初赛阶段一与初赛阶段二共用初赛数据集。

复赛环节提供复赛评估集、复赛商品库,选手无法下载,只能提交代码线上调用

复赛评估集包含图片数据及注释文件。图片数据为密集商品图片,格式为jpg。在线打分时,图像数据位于给定文件夹中。注释文件只包含图片名称与图片id的映射关系,选手算法预测结果需遵循该映射关系。如图片中出现多个商品实例,每个商品可以任意顺序标注,评测时将被独立计算。

复赛商品库包含了图片数据集及标注信息。图片数据集为稀疏商品图片,格式为jpg,每张图片仅包含一个商品,同一商品在商品库中有多张图片,尽量覆盖各商品在柜中不同位置及角度。在线打分时,图像数据位于给定文件夹中。复赛商品库的作用为,对于复赛评估集中给定商品实例,可以依据从商品库中检索出来的最相似的商品列表及对应类别信息,给出商品实例的类别预测信息。

本次比赛允许参赛选手使用其他公开数据集和公开模型,但参赛选手的模型必须满足能在限定时间内复现的要求,复现精度小于规定误差,并且需要注明使用的公开数据集、下载地址及公开模型。


参赛说明

参赛对象

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方集团员工参赛(包括内部与外部选手组队),可参与排名,但不占用晋级名额,不参与评奖及领取奖金。

比赛作品说明

参赛作品的知识产权归参赛作者所有。组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整

组委会权责说明

主办方享有优先购买参赛选手优秀作品的权利。

组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现参赛团队作弊等违规情况,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

联系方式

官方唯一交流QQ群:群号716424192

","memberCount":13,"teamCount":7,"startTime":"2021-07-05 00:40:00","id":27,"endTime":"2021-08-16 23:59:59","introduction":"第六届信也科技杯图像算法大赛,于2021年5月22日至2021年8月期间举行,总奖池高达31万人民币。本届大赛以智能零售为场景,提供真实图片数据,探索智能零售领域的图像识别方案,从而让机器更精准地识别商品,通过更快捷地购物带来全新的客户体验。"},{"imgUrl":"https://aifile.ppdai.com/0f946fa4e2c342898c0251109d5553e0..png","matchName":"第七届信也科技杯图算法大赛——欺诈用户风险识别","bonusAmount":310000.0,"matchDesc":"

大赛概况

本届大赛以智能风控为场景,在图算法领域探索满足反欺诈需求的应用方案。参赛前请详细阅读网站赛事说明和“操作手册”


初赛评测阶段开始后,报名组队成功的选手可前往“数据集下载”区下载初赛图数据。参赛团队本地训练和调试模型后,在线提交测试样本的预测结果。主办方根据提交结果计算得分,并以每队的最优成绩排名。排行榜实时显示最新结果。请选手注意预测结果提交通道将于2022/07/14 23:59:59关闭。

初赛复审阶段开始后,参赛团队需按照要求提交初赛评测阶段的模型代码。组委会将对代码进行线下审核,结合初赛评测阶段排名和审核结果选取前30名(不含内部参赛员工)参赛队伍入围复赛。


复赛评测阶段开始后,团队需提交docker镜像对复赛测试样本进行在线推断(复赛图数据不公开)。主办方根据镜像预测结果计算得分,并以每队最优成绩排名。请选手注意镜像地址提交通道将于2022/08/13 23:59:59关闭。

复赛审核阶段主办方将对团队在复赛评测阶段提交的docker镜像进行审核,结合复赛评测阶段排名和审核结果,主办方将邀请TOP 15的团队提交决赛材料。

决赛提交材料阶段参赛团队需按照要求提交决赛所需材料,包括决赛答辩PPT、复赛阶段模型训练&推断代码的docker镜像等。

决赛审核阶段主办方将对团队提交的决赛材料进行审核,并邀请前10名参赛团队进行决赛答辩。

决赛将以答辩的方式进行,主办方会邀请权威评委对各选手的答辩内容做点评,并根据选手综合表现给出评分。最终会结合复赛客观成绩和现场答辩成绩加权平均后给出名次。

决赛具体时间将另行通知。


赛题描述

反欺诈是金融行业永恒的主题,在互联网金融信贷业务中,数字金融反欺诈技术已经得到广泛应用并取得良好效果,这其中包括了近几年迅速发展并在各个领域得到越来越广泛应用的图神经网络。本届大赛的主办方信也科技,是一家致力于通过大数据、人工智能等先进技术,为互联网信贷用户与金融机构提供桥接平台的金融科技集团。在本届大赛中,信也科技以互联网智能风控为背景,从用户相互关联和影响的视角,探索满足风控反欺诈领域需求的,可拓展、高效的图神经网络应用方案,从而帮助更好地识别欺诈用户。

数据描述

本届大赛的初赛和复赛各提供一个脱敏的全连通的社交网络有向动态图,分别抽样于信也科技公司不同业务时间段的数据。在本届大赛提供的图数据中,节点代表信也科技的注册用户,从节点A指向节点B的有向边代表用户A将用户B填为他的紧急联系人。图中的边有不同的类型,代表了对紧急联系人的不同分类。图中的边上带有创建日期信息,初赛和复赛的两张图中,边的创建日期分别脱敏成从1开始的正整数,时间单位为天。另外,初赛和复赛的两张动态图均经过采样且包含小部分噪音。

预测任务

本届大赛的预测任务为识别欺诈用户的节点预测任务。虽然本届大赛的图数据中有四类节点,但是预测任务只需要将欺诈用户(Class 1)从正常用户(Class 0)中区分出来;这两类节点被称为前景节点。图中另外两类用户(Class 2和 Class 3)尽管在数目上占据更大的比例,但是他们的分类与用户是否欺诈无关,因此预测任务不包含这两类节点;这两类节点被称为背景节点。

与常规的结构化数据不同,图算法可以通过研究对象之间的复杂关系来提高模型预测效果。而本届大赛除了提供前景节点之间的社交关系,还提供了大量的背景节点。希望选手可以充分挖掘各类用户之间的关联和影响力,提出可拓展、高效的图神经网络模型,将隐藏在正常用户中的欺诈用户识别出来。

初赛环节的图数据可下载,选手提交初赛测试样本的预测结果。

复赛环节的图数据不可下载,选手使用初赛图数据作为训练数据,提交docker镜像对复赛测试样本进行线上推断。

此外,基于安全考虑,复赛线上推断环节中容器内无可用网络,由于网络访问禁用导致无法运行代码的情况由选手自行承担后果。

本次比赛允许参赛选手使用其他公开图数据和公开模型,但参赛选手需要在2022/07/06日之前向主办方报备注明使用的公开图数据、下载地址及公开模型。


参赛说明

参赛对象

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方集团员工参赛(包括内部与外部选手组队),可参与排名,但不占用晋级名额,不参与评奖及领取奖金。

比赛作品说明

参赛作品的知识产权归参赛作者所有。组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整。

组委会权责说明

主办方享有优先购买参赛选手优秀作品的权利。

组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现参赛团队作弊等违规情况,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

官方唯一交流QQ群:群号716424192

","memberCount":843,"teamCount":464,"startTime":"2022-06-11 00:00:00","id":28,"endTime":"2022-08-29 23:59:59","introduction":"第七届信也科技杯图算法大赛,于2022年6月11日至2022年9月期间举行,总奖池高达31万人民币。本届大赛以智能风控为场景,从用户相互关联和影响的视角,探索满足风控反欺诈领域需求的,可拓展、高效的图神经网络应用方案,从而帮助更好地识别欺诈用户。"},{"imgUrl":"https://aifile.ppdai.com/bac302127cfd4ec6bb64a2472cb6b713..jpg","matchName":"第八届信也科技杯智能语音大赛——语音方言距离识别","bonusAmount":310000.0,"matchDesc":"

大赛概况

本届大赛以“智能语音质检,提升用户体验”为背景,探索利用AI技术识别和还原语音数据中的方言信息,特别是不同方言之间的距离特征的问题。这一问题有助于更好地理解汉语语音及其方言、口音特征,以及将相关技术从理论到实际应用的实现,以进一步支持对用户的更好服务。参赛前请详细阅读网站赛事说明和操作手册

初赛评测阶段开始后,报名组队成功的选手可前往“数据集下载”区下载初赛语音和相关标签数据。参赛团队本地训练和调试模型后,在线提交测试样本的预测结果。主办方根据提交结果计算得分,并以每队的最优成绩排名。排行榜实时显示最新结果。请特别注意预测结果提交通道将于2023/08/25 23:59:59关闭。

初赛复审阶段开始后,参赛团队需按照要求提交初赛评测阶段的模型代码。组委会将对代码进行线下审核,结合初赛评测阶段排名和审核结果选取前30支(不含内部参赛员工)参赛队伍入围复赛。

复赛评测阶段开始后,团队需提交docker镜像对复赛测试样本进行在线推断(复赛测试样本数据在比赛期间不公开)。组委会根据镜像预测结果计算得分,并以每队最优成绩排名。请选手注意镜像地址提交通道将于2023/09/22 23:59:59关闭。

复赛审核阶段主办方将对团队在复赛评测阶段提交的docker镜像进行审核,结合复赛评测阶段排名和审核结果,主办方将邀请TOP 15的团队提交决赛材料。

决赛提交材料阶段参赛团队需按照要求提交决赛所需材料,包括决赛答辩PPT、复赛阶段模型训练&推断代码的docker镜像等。

决赛审核阶段主办方将对团队提交的决赛材料进行审核,并邀请审核通过的团队进行决赛答辩。

决赛将以答辩的方式进行,主办方会邀请权威评委对各选手的答辩内容做点评,并根据选手综合表现给出评分。最终会结合复赛客观成绩和现场答辩成绩加权平均后给出名次。

决赛具体时间将另行通知。


赛题描述

信也科技持续投入科研创新,致力于为客户提供更优质的金融服务,其中也包括更准确的用户理解和更好的服务体验。今年5月15日,集团宣布成立消费者权益保护委员会,全面统筹集团及旗下各业务线的消费者权益保护工作。这一举措表明了公司在消费者权益保护方面付出的努力。语音和NLP技术是客户理解中的一个重要工具。在不断扩展的客户理解维度中,有一个重要的任务就是将客服人员和客户沟通的过程中产生的大量语音数据,进行完善的分析质检,这需要语音、NLP算法进行批量的处理、分析、质检。通常质检任务的第一步算法就是ASR转写。

在ASR转写中存在的一个实际问题是,部分客户使用方言进行交谈,这样通用ASR模型就无法转写得到正确的文字。同时我们注意到,大多数可用的汉语ASR模型不支持方言或覆盖很有限的几种方言。对于国内仍广泛使用、大量存在且种类繁多的方言语音,商业解决方案还不能满足大部分方言的转写。如果考虑对所有方言单独建ASR模型,其成本是不可接受的;一个相对可行的方案:设置一系列核心方言并建ASR模型,对未知的方言进行鉴别,确定距离其最近的m (m >=1 )种核心方言,再尝试用这m种ASR引擎转写该未知方言,转写的不完美结果可用于支持下游任务:

未知方言转文字方案

上述假想方案可以理解为本届比赛的一个应用背景,可以看到,度量不同方言之间的距离是问题的关键。语音本身的方言或语言属性,已经有很多研究进行了探索,特别是和语言分类(LID)、方言分类(DID)等相关的问题。组委会认为,研究方言距离(或相似性)问题,有助于进一步探索如何从语音层面建模方言、进行方言特征抽取、分析方言形成和演化的机理,其结果也可以和传统方言分类方法做合理性的相互印证,以及服务于更为广泛的研究目标。从比赛方案产生的优秀方案,也可用来拓展商用ASR接口的模型适用范围,为核心方言引擎的布局找到最优方案,支持其他建模任务和应用。因此,基于以上研究和应用两方面的动机,第八届信也科技杯以“方言距离度量”作为赛题,向全社会征集优秀的算法方案。

赛题详细描述请参见链接文档:赛题描述

参赛说明

参赛对象

大赛面向全社会开放,国内外高等院校、科研院所、互联网企业等均可报名参赛,组队上限5人。

注:1)大赛组织机构单位中涉及题目编写、数据接触的人员禁止参赛;2)主办方集团员工参赛(包括内部与外部选手组队),可参与排名,但不占用晋级名额,不参与评奖及领取奖金。

比赛作品说明

参赛作品的知识产权归参赛作者所有。组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。

参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。

参赛选手需要自行检查提交作品的正确性,确认无误后再进行提交,组委会不负责对比赛作品进行更改和调整。

组委会权责说明

主办方享有优先购买参赛选手优秀作品的权利。

组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。

组委会拥有比赛作弊行为的判定权利和处置权利。

组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。

若出现参赛团队作弊等违规情况,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。

对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。

若因故出现数据更新、评审代码更新、作弊检查等原因组委会有权对参赛结果进行重新测评并更新排行榜。

组委会有权将参赛作品、作品相关、参赛团队信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

参赛团队在比赛过程中若被要求提交个人身份信息,组委会承诺个人信息仅用于赛事数据授权与颁奖,对其中所有涉及个人隐私的内容予以保密。

反作弊机制

参赛者禁止注册多账户报名比赛,经发现将取消比赛成绩并严肃处理。

参赛者禁止在指定考核技术能力的范围外利用规则漏洞或技术漏洞等不良途径提高成绩排名,经发现将取消比赛成绩并严肃处理。

参赛者禁止在比赛中抄袭他人作品,经发现将取消比赛成绩并严肃处理。

可以接触到赛题相关数据的人员的比赛作品将不计入最终排行榜参与评奖。

官方唯一交流QQ群:群号716424192


","memberCount":370,"teamCount":207,"startTime":"2023-07-10 00:00:00","id":30,"endTime":"2023-10-24 23:59:59","introduction":"本届大赛以“智能语音质检,提升用户体验”为背景,探索利用AI技术识别和还原语音数据中的方言信息,特别是不同方言之间的距离特征的问题。这一问题有助于更好地理解汉语语音及其方言、口音特征,以及将相关技术从理论到实际应用的实现,以进一步支持对用户的更好服务。"},{"imgUrl":"https://aifile.ppdai.com/0332a8e6839b400599eeef51296ba251..jpg","matchName":"第九届信也科技杯全球AI算法大赛——语音深度鉴伪识别","bonusAmount":310000.0,"matchDesc":"

","memberCount":709,"teamCount":461,"startTime":"2024-05-10 00:00:00","id":34,"endTime":"2024-07-23 23:59:59","introduction":"本届全球算法大赛聚焦语音深度鉴伪,挑战前沿AI技术,以推动国际合作,引导科技向善。"},{"imgUrl":"https://aifile.ppdai.com/703a3a940cc2441587c12df06f45d0e5..png","matchName":"第十届信也科技杯全球AI算法大赛——视觉深度鉴伪识别","bonusAmount":308000.0,"matchDesc":"

","memberCount":652,"teamCount":426,"startTime":"2025-06-24 00:00:00","id":36,"endTime":"2025-09-24 23:59:59","introduction":"本届全球AI算法大赛聚焦视觉深度鉴伪,挑战前沿AI技术,构建生成式AI安全基座,以推动国际合作,引导科技向善。"}],"status":0}