2016-09-25 17:07 来源:网友分享
2016年09月23日讯 日前,中国科学院青岛生物能源与过程研究所单细胞研究中心正式发布首个微生物组大数据搜索引擎--MSE(Microbiome Search Engine),使得以整个微生物组为分析单元的智能搜索和大数据挖掘成为现实。
微生物组,又称“菌群”。人体微生物组也被称为每个人的“第二基因组”。一个“第二基因组”可由数百万个微生物基因组成,其数据量是一个人类基因组的成百上千倍。根据人类已经积累的海量微生物组数据,寻找“结构”或“功能”类似的菌群样本,从而实现对未知功能菌群的解读和挖掘,以及对整个已知微生物组数据空间的全局性思考,一直是微生物组业界的关键瓶颈之一。对海量微生物组“大数据”的搜索、挖掘与机器学习,能够帮助人们了解微生物组与相关疾病之间的关系,从而利用人体各个部位的共生菌群实现个体化的精准健康、精准护理与精准营养。
MSE通过建立针对微生物群落的超高速比对算法和数字索引机制,为海量的样本列出基于菌群结构或功能相似性的“目录”。当输入未知样本时,引擎能够根据这一带有菌群相似性信息的“目录”从浩瀚的微生物组大数据海洋中迅速自动选取与该样本最为相似的匹配。
配合该搜索引擎,单细胞研究中心还发布了分析软件Parallel-META 3 ,可以将数量庞大的未知微生物组样本进行结构与功能解析,可以与其数据库搜索匹配结果进行更深入的比对分析。
基因组简介
人类只有一个基因组,大约有2.5万个基因。人类基因组计划是美国科学家于1985年率先提出的,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。计划于1990年正式启动,这一价值30亿美元的计划的目标是,为30亿个碱基对构成的人类基因组精确测序,从而最终弄清楚每种基因制造的蛋白质及其作用。打个比方,这一过程就好像以步行的方式画出从北京到上海的路线图,并标明沿途的每一座山峰与山谷,虽然很慢,但非常精确。