2016-09-14 22:10 来源:网友分享
2016年09月14日讯 9月13日,国内基因测序公司北京贝瑞和康生物技术股份有限公司宣布完成全球首个中国人群基因组数据库"神州基因组数据云"的建设,填补了国际基因数据库中缺少中国人群特有基因组数据信息的空白。贝瑞和康透露,国内最大的云计算服务商阿里云为项目提供了计算支持,原定需要半年的计算量在1周时间就完成了。
什么是基因组数据库?自基因测序技术被发明以来,建设人类基因组数据库一直是各国基因组研究中心的核心内容之一。人类基因组数据库包含了不同的基因对应的疾病风险,就像是基因版的《本草纲目》。
以现在日趋流行的个人基因测序为例,你只需提供唾液,基因测序公司便可以对你进行基因测序,并给出可能患各种疾病的可能。这种判断的准确性,强烈依赖于基因组数据库。但现在,国内科研和医疗机构使用的数据库,均为国际通用数据库。而这部分数据的来源,大多是西方白种人。
来自美国贝勒医学院,现任职贝瑞和康CIO的于福利教授说,不同的人种有明显的基因差异,建立高质量的中国人群基因组数据库已经成为当下制约分子医学发展的重要壁垒。
"虽然我国很容易获得大量基因数据,但一个真正的基因组数据库并不是简单的数据累积,它需要有资深遗传学背景,能够对遗传信息进行深刻解读,具备专业的计算编程能力同时又具有大数据项目的建设经验和强悍的计算能力支持。"于福利教授说。
贝瑞和康是国内基因测序领域的领跑者,在生物信息领域优势明显。但整个项目数据量超过100TB,相当于1000部高清电影,让一家生物公司难免头疼。这正是贝瑞和康向阿里云寻求合作的原因。
在计算能力方面,阿里云曾打破四项世界纪录,擅长大数据量的处理。阿里云高级专家林河山说,海量基因数据的挖掘需要强大的计算资源支持。在和贝瑞和康的合作中,阿里云通过批量计算服务为项目提供了稳定、低成本、强悍的计算支持,仅用1周就完成了40万人基因组数据的分析。
林河山介绍,同样的计算在用户本地的HPC集群需要半年的时间才能完成。"我们很高兴能够通过支持贝瑞和康的工作参与到推动我国精准医学实质性临床应用层面中来"。
除了贝瑞和康以外,包括华大基因等在内的行业领军者均是阿里云的用户。据了解,在即将召开的云栖大会上,阿里云设置了基因计算专场,多家全球领先的基因公司将参与讨论,就计算与生命科学结合的优秀实践和发展方向进行深入交流。