往届赛事

2021年“数源杯”百万单细胞基因表达数据算法大赛

The Mammoth International Contest on Omics Science
大赛简介

“数源杯”百万单细胞基因表达数据算法大赛于5月17日正式开启,鼓励相关领域的研究人员和从业者以国家基因库生命大数据平台存储的百万单细胞数据资源为基础,针对“聚类”这一单细胞数据分析的重要步骤,进行单细胞聚类算法的开发和优化,进而打造能够降低内存占用、提升运算速度的优质计算工具;与此同时,为生命科学、医学、计算机科学等多领域的专业人才提供跨领域、跨学科的技术交流平台。本次大赛吸引了国内外100余家知名高校和近90家企事业单位的专业技术人员参与,包括北京大学、清华大学、波士顿大学、费城儿童医院、中科院计算所、华为、腾讯、百度、平安科技等。累计提交作品1819个。

The Mammoth International Contest on Omics Science
赛题设置

“数源杯”百万单细胞基因表达数据算法大赛:本次大赛旨在提升单细胞聚类算法的性能,要求参赛者利用主办方提供的数据资源,在保证分析结果准确性的前提下,开发/优化单细胞聚类算法,减少内存、提升运算速度。
单细胞转录组测序(scRNA-seq)已成为鉴定和表征细胞类型、状态、谱系和网络的核心工具。细胞聚类是单细胞数据分析的一个常见步骤。聚类分析的目的是在待定义细胞类型的数据集中保留主要的变异来源,同时尽量屏蔽由于无用的变异来源(测序深度、细胞周期差异、线粒体表达、批次效应等)而产生的变异。目前已有多个成熟的单细胞聚类算法,例如经典的层次聚类和K-means,以及专门为单细胞技术开发的SC3聚类等。然而,随着单细胞数据的不断产出,数据处理的通量将不断攀升,所以单细胞聚类算法的性能也需要不断提升。

The Mammoth International Contest on Omics Science
大赛形式

1. 参赛者需完成组队(每队最多5人),并以团队身份报名和提交各阶段的作品材料。一名参赛人员仅允许参与一支参赛队伍。
2. 参赛队伍在比赛平台下载数据资源,在本地完成算法优化,并按照大赛日程按时提交各阶段作品。作品包括分析结果、算法源代码和相关说明文档(数据预处理说明文档、算法模型说明文档、算法运行(环境)说明文档),其中初赛环节还需要提交团队介绍材料,决赛环节还需要准备答辩材料(PPT)。
3. 本次大赛邀请单细胞和大数据领域的大咖组成专家团,对每个环节环节的作品进行代码评审和综合评审;
* 初赛前期可报名、观看培训视频、与专家团在线互动。

奖项设置

一等奖:1支队伍,奖金20,000元
二等奖:2支队伍,奖金10,000元
三等奖:3支队伍,奖金3,000元
四等奖:4支队伍,奖金1,000元

获奖名单
排名 队伍名称 机构
一等奖 打野不在我怎么去(柳嘉鑫) 华中科技大学
二等奖 FakeDr(曹政) 浙江大学
精英小分队(徐云佩) 中南大学
三等奖 多喝热水(任君) 厦门大学
摸鱼三壬行(陈盛泉、房鋆、李震) 清华大学
想吃下午茶(冯德华、钟煜) 波士顿大学、西安交通大学
优秀奖 多少人跨不过热爱的坎(陈瑀璇、陈思琪、梁珍兰、郑瑞清、严旭画) 中南大学
顶级理解(胡靖、刘子敬、薛洋、朱俊、邹薇瑾) 同济大学、百度中国等
西地那非(唐晓伟、王霖庶) 北京大学
三乘二减一(廖静怡、黄芝雯、程楠、徐顺拓) 华东师范大学