无数科学家都想通过研究细胞来更深入地了解人体,2016年,人类细胞图谱计划(HCA)诞生了,全球超过40个国家的科学家、医生和研究人员参与其中,绘制人体内每种类型细胞的分子图谱并共享,试图解析更多人体的奥秘。
而在杭州,就有这样一个团队,也是通过小小的细胞来探究生物的秘密。10月30日下午,浙江大学良渚实验室特聘研究员王晶晶带来了这一期的“科技成果科普发布”,向大家揭秘新时代的“女娲”和“华佗”。
揭示生命有序性的“女娲”
在我国的古代神话中,“女娲”是大地之母,她创造出形形色色的人类。而王晶晶团队构建的“女娲”(Nvwa),其实是一个人工智能深度学习模型,这个模型首次实现了完全基于基因组序列预测单细胞分辨率下的基因表达。
我们知道,基因组是一个生物体所携带的全部遗传信息。我们体内的绝大多数细胞包含着相同的基因组,由于有的基因转录,有的不转录,才出现了各种各样的细胞类型。
那么,基因究竟是如何进行选择性表达的?这一点,生物学家至今仍在寻找一个确切的答案。王晶晶所在团队——浙江大学细胞图谱实验室,利用自主研发的高通量单细胞测序平台Microwell-seq,绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,从而揭示了脊椎动物细胞类型保守的调控程序。王晶晶向大家解释,“物种虽然千差万别,但细胞类型命运的决定可能有共性存在——换句话说,生命看似是‘紊乱’的,但我们想通过这些算法,把其中的‘有序性’给解释出来。”
未来,“女娲”可以应用到各种疾病研究中,它的预测模式能够更好地识别因果位点,为疾病的精准治疗,包括器官移植、基因治疗等疗法提供预测性的见解。
可以预测遗传病的“华佗”
“华佗”是我国古代最著名的医生之一,他用神乎奇技的医术治百病,而现代的“华佗”则是一种分析框架,它仅仅依据来自少量生物学个体的基因表达谱,实现对突变转录效应在细胞类型水平上的推断。这为我们解析复杂的基因表达遗传调控机制提供了一种高效途径。
王晶晶介绍说,人类基因组计划完成20年以来,基因组学的研究已经取得了相当大的进展。然而,由30亿碱基对组成的人类基因组序列绝大部分都是非编码区域,我们对其潜在功能的理解只是冰山一角。
而Huatuo(华佗)的出现,帮助构建了一个全面的细胞类型特异性基因调控遗传变异景观,并通过各种基准测试验证了分析结果的合理性,为复杂性状和疾病的驱动细胞类型和因果变异提供了系统性见解。“未来,我们希望抽一管血就可以预测一个人将来是否会得遗传病”,王晶晶向大家描述这些基础研究的未来应用场景。
【科学TALK】
生物信息×人工智能
问:生物信息学领域未来会有哪些科技创新的趋势和方向?
答:我们以前做生物信息方面的研究,感觉一直在整合数据,现在人工智能的出现给我们提供了一个非常好的工具,可以帮助我们把这么多形态的数据整合在一起。这也会是未来的研究趋势。
问:人工智能和生物学的结合已经带来了什么突破?未来还可能有什么变革?
答:目前,人工智能已经在蛋白结构预测、细胞类型注释、疾病预测等方向带来了新的突破。但人工智能“黑箱”的性质也导致了很多应用与分析上的限制。比如,部分模型虽然具有较高的疾病预测能力,但不能解释是什么因素导致了疾病的产生。
在“女娲”模型的构建中,我们虽然揭示了细胞类型特异的基序,但暂时还是无法往模型的更深层走。未来,结合领域专家知识、具有生物学解释能力的人工智能算法或能带来更大的变革。ABOUT.科技成果科普发布
作为全国样本、浙江创新,由浙江省科协和都市快报联手打造的“科技成果科普发布”已经举办了五年,持续关注前沿科技,打造了“国家级—省级—市级—(区)县级”四级联动、协同发展、社会科普资源互通共享的新局面。每期活动都会请到深耕一线的科学家来讲述最前沿的科技成果和成果背后的科学故事。