阿里巴巴大数据竞赛

发布者:系统管理员发布时间:2014-07-07浏览次数:263

大赛简介

阿里巴巴大数据竞赛是阿里巴巴集团主办,在阿里巴巴大数据科研平台——“天池”上开展的,基于天猫海量真实用户的访问数据的推荐算法大赛。

本次比赛的目的是让广大的高校同学在大数据时代的背景下,有机会学习和利用阿里巴巴的大数据和云计算平台,尝试解决真实的业务与社会问题。


整个比赛分为三季(season):

Season 1:2014年3月10日至4月20日,参赛者可以下载少量天猫的真实行为数据,并在本地调试算法,提交结果。

Season 2:2014年4月25日至7月30日,参赛者须使用“天池”平台(阿里巴巴自主研发的分布式计算平台),访问海量的天猫数据,并利用MapReduce、SQL及各种平台集成的机器学习算法包调试模型、提交结果。

Season 3(即线上赛,实战双11):2014年10月至11月,Season 2的top选手可以访问天猫,参与2014年双11的真实算法设计,并有机会获取百万大奖。

报名规则

参赛对象

全日制高校(研究院所)本科、硕士、博士均可参赛

组队规则

参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人(可以跨学院跨学校)。如果是多人团队,则需指定一名队长,负责沟通事宜。另外每个队伍可以配备指导老师一名。

注:

1.  每人只能参加一支队伍;

2.  保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励;

3.  进入season2后,不允许变更队伍成员;

4.  报名时间:只要在4月20日0:00(season1截止)之前报名即可。鼓励大家早点报名,可以早点接触到数据,以确保参赛时间充足;

5.  报名方式:官网注册账号后报名即可;

6.  交流论坛:http://bbs.aliyun.com/thread/187.html?type=738

赛制安排

环节 时间 规则

Season 1 3月10日—4月20日

利用可下载的少量天猫数据,建模与提交结果。

每天提供1次算法提交机会(提交截止时间为每天凌晨2点),隔天公布排行榜,

按照F1分从高到低排序;

4.20日选出第一赛季最好成绩排名在前500名的队伍进入第二赛季;

Season 2 4月25日-7月30日

参赛者需登录阿里巴巴天池平台,访问海量天猫数据。利用天池平台的集成工具与算法,建模与提交结果。

评审规则:每天提供1次算法提交机会,每天更新排行榜,按照F1分从高到低排序。(排行榜将选择选手在本阶段的历史最优成绩进行排名展示,选手每日的成绩请至个人中心查询)

7.24将重新抽样一批相同量级的数据(保证抽样方式一致),7.30零点截止算法的提交,并取7.24-7.30最优成绩前Top10的参赛队进入最终评审。

Top10的参赛队,需要准备评审材料,在8月20日来杭州参加答辩,根据参赛队的算法原理、season2的成绩,决出最终的冠亚季军。

Season 3 10-11月 (线上赛)

邀请决赛成绩TOP3的参赛队参与天猫线上算法的设计,并在双11当天检验效果,根据线上AB Test 结果,决定最终成绩,赢取100w大奖。整个过程将由媒体全程跟踪和监督。

奖项设置:

Season 1 不设奖项,但是会从参赛队伍中选择较优者进入Season 2阶段比赛

Season 2 阶段奖项:

一等奖:1支队伍,奖金贰拾万

二等奖:1支队伍,奖金伍万

三等奖:1支队伍,奖金贰万

(上述奖项以决赛答辩成绩的最终名次决定)

月星星奖:每期月度榜单排名Top10的参赛队成员都将获得搭载云OS的手机一部(具体手机型号在公布榜单时公布)

优胜奖:决赛全国赛排名Top50的参赛队成员直接进入阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段) ,在校期间均有效;并将获得阿里纪念T恤和大赛获奖证书

总决赛Top10的主要参赛队成员可直接入围“阿里星”计划,参赛队的指导老师(如有)将享受天池数据的最高使用权限1年

Season 3 线上阶段奖项:

Season 2 阶段的优胜者,将会受邀访问天猫,在天猫实际开发2014年双11线上算法,并有机会赢取100万大奖(组委会将在Season 2结束后公布细则)

主办方

阿里巴巴集团

合作方

中国中文信息学会、InfoQ技术媒体、SF社区

http://102.alibaba.com/competition/addDiscovery/gameIntroduce.htm


Baidu
sogou