信息技术与经济社会的交汇融合引发了数据迅猛增长,数据已成为国家基础性战略资源。为满足海洋、能源等领域对大数据人才的需求,我校设置了大数据相关专业,培养具有数据科学基础和数据思维能力,能够在数据科学和大数据技术领域中从事科学研究、应用开发和教学的具有国际视野的高素质专门技术人才。特别在2020版新的培养方案中,大数据或人工智能与各专业的交叉融合已经成为重要的修订目标。
为促进大数据对相关专业课程体系、教学内容和教学方法等教学资源的质量提升,推动校企合作,培养学生的创新意识,让学生在真实行业问题的解决过程当中锻炼实践能力,特举办本次数据竞赛,以赛促教、以赛促学。
一、赛训目标
本次赛训设置1道赛题,围绕疾病预测主题。并针对赛题设置阶段性任务,将解题过程拆解为多个关键阶段,帮助学生边学边练,一步步完成赛题,达到终点。
二、主办单位
教务处、理学院、和鲸科技、山东省大数据人才培训示范基地
三、赛题设置
本次数据竞赛围绕疾病预测结构化数据进行。疾病的预测往往能够从病人的病历历史数据挖掘当中获益,而许多有价值的发现也往往是在对于结构化数据的建模与分析之中得出的。本赛题希望通过结构化的数据预测与分析,判断对一名病人是否会出现急性肝功能衰竭的情况。
数据集共包含6000名20岁以上的成年人在2008-2009和2014-2015的两次调查的情况。训练集的比例为70%,测试集的比例为30%。
详情见赛事页面:
https://www.heywhale.com/home/competition/60a20196ca31cd0017837147
四、赛训章程
竞赛时间:2021年5月27日-6月14日
报名截止时间:2021年6月10日
整个数据竞赛将分为3个阶段:前两个阶段为训练营,帮助学生学习成长;最后一个阶段包含正赛,学生将在该阶段中检验自己的实力。每个阶段给出相应的学习材料和练习,通过学习材料以及完成对应的练习,可自动晋级到下一个阶段。
第一阶段:结构化数据的探索性分析
第二阶段:机器学习基础与原型搭建
第三阶段:大数据时代的深度学习模型介绍与正赛
整个竞赛过程中,为学生提供线上的学习、训练和参赛一体化的环境。学生需使用指定的算力(一块2核8G的CPU不限时,一块4核16G的CPU60小时)完成比赛。数据不提供下载。
五、参赛与报名
本次数据竞赛为中国石油大学(华东)校内赛,仅针对中国石油大学(华东)在校学生。
有意参赛的学生加入QQ群:702630113(验证信息:学校全称/专业班级/姓名,信息不全者不予通过),并通过上面赛事页面,自主报名。报名时需提交学生证照片,通过资质审核(报名人为本校在校学生)后,即为报名成功。完成报名的学生可自行组队,以团队单位参赛,每个团队最多3人,最少一人。
六、赛训奖励
对于参加训练营并通过基本考核的获得训练营结项证书。而竞赛奖项设置为一等奖、二等奖和三等奖,具体数量视参赛人数而定,届时在数学文化节颁发获奖证书和奖品。此外,获得竞赛获奖证书者,予以我校第二课堂创新创业类学时导入。
七、注意事项
1.数据隐私
(1)主办方与数据提供方授权参赛人员使用提供的数据进行指定比赛的模型训练工作,参赛人员不得将数据用于任何商业用途。
(2)参赛人员不得对提供的加密信息/脱敏数据进行效仿、逆向工程、反编译、试图破译源代码及潜在信息等行为。
(3)参赛人员不得使用数据从事危害国家安全、社会公共利益和他人合法权益的活动
2.知识产权保护
(1)参赛作品必须保证原创性,不违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,组委会将取消其比赛成绩并进行严肃处理。
(2)参赛选手需要配合组委会对比赛作品的有效性与真实性进行验证。
3.反作弊声明
(1)参赛选手不得以任何形式,抄袭他人作品。
(2)参赛选手不得以任何形式,进行不正当竞争。
4.组委会权责
(1)组委会保留对比赛规则进行调整修改的权利,并拥有对大赛规则的最终解释权。
(2)组委会拥有比赛作弊行为的判定权利和处置权利。
(3)组委会保留修改比赛作品的提交截止日期和路演日期的权利,组委会有权在特殊条件下暂停或终止比赛。
(4)若出现不可控因素,组委会保留调整比赛各阶段入选团队数量的权利,以及调整奖项设置的权利。
(5)对影响比赛组织及比赛公平性的参赛团队,组委会保留收回或拒绝授予其奖项的权利。
教务处
理学院
和鲸科技
山东省大数据人才培训示范基地
2021年5月24日