打造“通天塔”,构建微生物数据科学“高地”

中国科学报 2021-09-29 作者:冯丽妃

  有人曾这样形容:“掌握了一个生物保藏库,就相当于掌握了一大批工厂。”如今的微生物所,无疑就拥有这样一个世界级的宝库。

  落户在中国科学院微生物研究所的国内外微生物数据科学中心打造的全球微生物资源数据共享平台已经汇聚了来自51个国家141家合作伙伴的52万株微生物实物资源数据。“这说明作为全球最大的综合性微生物研究机构,微生物所正在国际合作中承担更多责任。”微生物所所长钱韦在接受《中国科学报》采访时说。

  “共享平台使我国科学家能以全球视野组织、协调各国相关力量,建立全球性的合作框架。同时,也推动着中国逐步在微生物资源的开发应用和数据共享方面占领国际微生物研究前沿和主导地位。”全球微生物资源数据共享平台负责人、国家微生物科学数据中心主任马俊才也表示。

  从分散数据到互联互通 

  作为一家有着60年所龄的研究机构,微生物所有着丰厚的家底。其中之一就是传承了四五代人的“微生物银行”——中国微生物菌种保藏管理委员会普通微生物中心(CGMCC)。

  “这是国内第一个通过国际标准化组织(ISO)认证的保藏中心,也是全球最大的微生物资源库之一。”钱韦自豪地介绍。据悉,该中心现保藏的实物菌种资源总量超过8万株,已成为我国重要科学研究和微生物资源的重要宝库。

  家有梧桐树,引得凤凰来。2010年,经过全球激烈竞争,世界微生物数据中心落户微生物所。11年来,全球共有77个国家的812个微生物资源保藏中心在该中心注册,成为我国“盘点”全球微生物及其遗传资源的重要平台。

  2019年,国家微生物科学数据中心作为20个首批启动的国家级科学数据中心之一启动,微生物所成为牵头单位,使我国微生物资源相关的一系列重要数据库进一步完善。

  作为一名大数据研究领域的专业“选手”,彼时马俊才同时肩挑世界和国家微生物科学数据中心负责人两个职位。但他还有更大的心思——解决长期以来全球微生物资源数据平台存在的各国数据分散、用户无法一站式检索的问题。

  于是,国家微生物科学数据中心和世界微生物数据中心牵头建立了全球微生物菌种保藏目录国际合作计划,搭建了全球微生物资源数据共享平台,汇聚了来自51个国家141家合作伙伴的52万株微生物实物资源数据,形成了全球互联互通的微生物数据信息化合作网络。

  在钱韦看来,这个平台就像一个“通天塔”,通过这个体系,中国可以组织和协调各国研究力量,建立全球性合作框架,在微生物资源整理整合和数据共享方面发挥引领和主导作用。

  制定标准 引领国际 

  在近日举行的2021年世界互联网大会乌镇峰会上,全球微生物资源数据共享平台入选首届全球12项“携手构建网络空间命运共同体精品案例”。“这对我们是很大的鼓励。”马俊才认为,所谓的“网络空间命运共同体”本质是通过国际合作让参与者受益。

  据介绍,该共享平台免费开放,所有微生物数据向全世界共享。“相当于全世界不同国家的微生物在一个统一的淘宝平台上展销。”马俊才说,它可以让发展中国家的微生物保藏中心和资源更好地得到全球的关注,提高知名度;对于发达国家来说,它可以提供其评价体系中强调的微生物资源对全世界所做的贡献。

  以欧洲最大的保藏中心德国微生物菌种保藏中心的菌种在全球使用情况为例,他表示,数据平台可以清晰显示出1987年以来,全世界用户用该中心的菌种发表多少文章,从而了解其在全世界的影响力。

  “这样的系统评价报告现在由我们出,我们的数据库具有权威性、完整性。”马俊才说,“就像身份证一样,凡是进入全球微生物资源保藏中心注册数据库系统的微生物资源,都有唯一编号和标识符。”

  据介绍,为了打造高质量国际性数据平台,国家微生物科学数据中心联合10多个国家相关领域的专家,共同制定了国际微生物资源领域的第一个ISO微生物资源数据标准,解决了长期以来由于各国微生物资源中心数据管理的不同形式带来的共享阻碍。

  不仅如此,中国国家微生物中心还启动了全球万种微生物模式菌株测序计划。目前已有16个国家的25个微生物保藏机构参与这一国际合作计划,并提供了DNA或者菌株资源,这使全球数据资源的共享真正发展成了国际微生物实物资源的合作。

  “虽然微生物会变异,但它有模式标准的依托。万种微生物测序就是以模式微生物为主,这是微生物分类学的标准参考物质。”钱韦解释,对其测序可以提高人类对微生物的认知能力,对生物技术研究和生物产业发展也具有重要的价值。

  据介绍,目前全世界科学家已发表的模式细菌有17800种,其中已经测序的仅有7000种,完成对其余1万余种模式细菌的测序正是研究团队的目标。对此,美国纽约大学教授Martin Blaser在发表于《科学》的评价中称:“这是一个非常好的起点”,也是“一个非常有价值的项目”。

  马俊才透露,目前这一引领的项目已完成4000多种模式微生物的测序。

  虚实结合 打造高地 

  “我们既拥有世界的,也拥有国家的数据库,这两套体系是我们在微生物资源研究和外合作交流方面的一个极大的优势。”钱韦说.

  据悉,十余年来,微生物所对世界微生物科学数据中心和国家微生物数据中心在人财物力方面给予了不遗余力的支持。目前,团队固定职员加项目聘用者总人数已达到六七十人,办公空间将近1500平方米。在酝酿两中心项目时,研究所经常领导班子全员出动,推动项目往前走。

  谈起对数据中心未来的期待,钱韦希望,它可以在数据科学的核心算法方面冲破挑战,解决相关的“卡脖子”问题;推进虚拟数据与实物保藏的联动,打造微生物领域的“物联网”,以数据带动知识体系和实物资源体系的发展;在微生物数据方面培养出世界级的大科学家。

  “正是在中国政府、中国科学院和微生物所的大力支持下,数据中心才有今天的面貌。”马俊才说。得益于这些支持,中心每年都会举办国际研讨会、培训班,甚至还走出国门,把相关会议和培训延伸到了国外,对于拓展国际合作起到了很好的作用。

  下一步,马俊才表示,全球微生物资源数据共享平台将进一步吸收更多的国际伙伴加入到这一合作网络,构建国际上最大、最权威的微生物识别平台;进一步开展数据挖掘应用,助力病原微生物防控决策,利用微生物支撑产业发展。他们还计划在国际上提出“完成人类全部原核生物的基因组测序”计划,以完善和重构生命系统发育树,建立基于组学数据的微生物分类“金标准”。

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
中国科学报
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢