2016-10-15 17:12 来源:网友分享
2016年10月07日讯 美国加州山景城--华大基因子公司Complete Genomics(简称CG)与个人基因组计划项目(简称PGP)共同发布了过百人的实验单体型定相全基因组测序结果。这组数据采用长片段阅读技术(简称LFR)读取,是目前最大的有全面实验确认单体型的高覆盖度全基因组组装。“绝大多数现有的基因组数据都没有实验获得的单体型。
CG高级研究主任和项目主导人Brock Peters博士解释道。“这是一组非常独特的数据,会通过开放数据发表方式免费提供给所有人使用。”PGP共招募了184人参与这个项目。每个人都同意将他们的身份、基因组及其表型数据免费公开获取。血样由PGP团队收集并送到CG进行DNA分离、LFR文库生成和全基因组测序。目前已经有114个基因组组装序列可以使用,其余的预计将会在接下来的几个月内公布。作为基因组数据发布的一部分,CG和PGP还在开放期刊GigaScience上发表了关于此数据的描述和全面的数据质量分析。
CG首席科学家Radoje Drmanac博士表示,2011年的时候,我们免费提供了69组全基因组测序数据,这组数据被迅速广泛使用,并成为了遗传学领域的基准和资源。“我们很荣幸能够延续传统,发表这组实验单体型全基因组组装集。这代表了目前可获取的最大最准确的人类单体型。”此次发表的变异体和定相数据均可在开放期刊GigaScience获得。所有基因组对应的序列和图谱将可通过基因型和表型数据库(dbGaP)获取。“CG先进的WGS、允许无限制访问的PGP知情同意政策以及GigaScience的开放存取数据发布形式,三者相互结合,实现了具有卓越科学价值的大数据组得到充分共享。我们希望这些数据能够被世界各地更多的研究人员使用。”PGP创始人George Church博士表示。
早在2012年CG就在Nature上发表过LFR技术,结果显示基因组质量和完整性都非常之高。这次GigaScience上发表的结果也再一次证明LFR的精准性和完整性。每个样品都是以100X的覆盖率进行测序,能够高准确度地检测出大多数变异,且98%以上的杂合变异位于接近1Mb的长组装区域。平均来说,85%以上的单体型不含错误,剩下15%的大部分只含单个定相误差。