东亚人的基因组起源

科普中国网 2019-07-29

  现代东亚人的早期历史

  关于当今东亚人群的第一个大规模基因组调查结果是在2009 年发表的,这个调查涵盖了来自大约75 个群体的近2 000 人。其中的一个调查结果得到了研究人员们的特别关注:东南亚的人类遗传多态性比东北亚的要更高一些。他们提出的解释是:有单一的一股现代人首先迁徙到了东南亚,然后再向北进入中国以及其他地方。这种模型遵从了一个更普遍的、能解释全球人群多态性模式的理论:有单一的一股现代人迁徙走出了非洲,然后往各个方向扩张,每衍生出一个新的群体,便丢失一部分遗传多态性。现在我们知道,这个关于东亚人群历史的理论模型很有可能并不准确。欧洲的历史上发生了多次群体替代和混血事件。从古DNA 研究中,我们也知道了当今欧亚大陆西部的遗传多态性模式并不是首批现代人迁徙进入该地区的准确反映。类似的,对于东亚,这个由南往北迁徙并沿途丢掉遗传多态性的理论模型是非常错误的。

  2015 年,王传超与我们合作分析一份珍贵的数据:来自大约40 个中国人群的、大约400 个现代个体的全基因组数据。在DNA 研究中,来自中国的样本非常稀少。王传超和他的同事们在中国完成遗传学实验,然后与我们合作分析电子化的数据。在接下来的一年半的时间里,我们把这些数据跟已经发表的其他东亚国家人群的数据和我们自己实验室生产的来自俄罗斯远东的古DNA 数据进行综合分析。这项研究帮助我们更深刻地认识东亚人群的历史,以及找到当下不同东亚人群的起源。

  通过主成分分析,我们发现当下的绝大多数东亚人的血统可以用3 个群组来描述。

  第一个群组的核心人群来自黑龙江流域,也就是当今中国东北部与俄罗斯的国界线区域。这个群组包含了我们以及其他实验室从黑龙江流域获得的古DNA。所以,这个区域的居民在过去超过8 000 年的时间里,都保持着遗传上的相似性。

  第二个群组的主要人群来自青藏高原,也就是喜马拉雅山以北的大片区域。这片区域的大多数地方的海拔都比欧洲的最高峰阿尔卑斯山还要高。

  第三个群组的主要人群来自东南亚,而且最具代表性的人群是中国大陆沿岸岛屿,例如海南和台湾的原住民。

  我们使用了四群体检验来评估不同的现代人群之间的关系。除了以上3 个群组的代表性人群,我们还纳入了美洲原住民、安达曼群岛原住民和新几内亚人。后面这3 个人群的祖先至少从末次冰期开始就跟东亚人的祖先基本隔离了,所以这些人群所携带的东亚人相关的遗传信息实际上就像是来自那个历史时期的古DNA。

  我们的分析结果支持这样的一个人群历史模型:当今绝大多数东亚人的现代人血统基本上来自两个很久之前便分离开的两个支系的混血,只是不同人群的融合比例不同而已。这两个支系的成员往各个方向扩张,它们相互之间,以及它们与其他遇见的人群间的混血,铸造了当今东亚的人群结构。

  长江和黄河流域的“幽灵群体”

  中国是世界上为数不多的独立的农业起源地之一。考古证据表明,从大约9 000 年起,农民们便开始在中国北部黄河流域的风沙沉积物里种植谷子以及其他作物了。大约在同一时期,在南边的长江流域,另一群农民也开始种植包括水稻在内的农作物。长江流域的农业文明沿着两条路线往外扩张:一条大陆路线,在大约5 000 年前到达了越南和泰国;一条海洋路线,在差不多同样的时间到达了台湾。在印度和中亚,中国农业文明和近东起源的农业文明发生了第一次碰撞。当今的语言分布也暗示了历史上可能的人群迁徙。当今东亚大陆上的语言至少可以分成11 个语系:汉藏语系、傣-卡岱语系(Tai-Kadai,也称侗傣语系)、南岛语系、南亚语系、苗瑶语系(Hmong-Mien)、日本语系(Japonic)、印欧语系、蒙古语系(Mongolic)、突厥语系(Turkic)、通古斯语系(Tungusic,也称满-通古斯语系),以及朝鲜语系(Koreanic,也称韩国语系或者高丽语系)。彼得·贝尔伍德主张这里边的前6 个语系是东亚农业文明往外扩张、传播他们的语言的结果。

  通过遗传学研究我们又发现了什么呢?当下我们从遗传学角度学到的关于东亚久远人群历史的知识非常有限,远远比欧亚大陆西部甚至美洲的要少。尽管如此,王传超还是从我们现有的少数古DNA 数据和当下人群的遗传多态性数据里得到了新的认识。

  我们发现在东南亚和中国台湾,许多人群的全部或者绝大多数祖源都来自一个同质化的祖先群体。因为这些人群的地理分布恰好跟长江流域水稻种植文化往外扩张的区域重合,我们不禁提出一个假说,认为这些人群就是历史上开创了水稻种植文化的人的后代。我们还没有来自长江流域首批农民的古DNA,但我的猜测是,他们应该跟这个构建的“长江流域幽灵群体”相吻合。我们说的这个“幽灵群体”便是为当下东南亚人群贡献了绝大多数血统的祖先群体。

  汉族人是世界上人口最多的群体,拥有超过12 亿人口。但是我们发现,他们并不是“长江流域幽灵群体”的直接后代。相反,汉族人有很大一部分血统来自另外一支、很久远以前就分化出去的东亚支系。北方汉族人有更多的血统来自该支系。这个发现也跟2009 年以来的另外一个发现相吻合,即汉族人内部有一个微小的从北到南的梯度性差异。如果历史上汉族人的祖先从北往南扩张,并沿途与当地人发生混血,那么我们发现的这些模式就可以得到解释。

  当王传超建立起关于东亚久远人群的历史模型时,他发现汉族人和藏族人都有很大一部分血统来自同一个祖先群体。这个群体独立的、纯种的血统已经不复存在,而且这个群体对许多东南亚人群并没有遗传贡献。基于考古学、语言学和遗传学的综合证据,我们把这个祖先群体叫作“黄河流域幽灵群体”。我们的假说认为,这个群体在黄河流域开始了农业文明并传播了汉藏语系的语言。来自黄河流域首批农民的古DNA 将会检验我们这个假说的对错。东亚的人群历史有着一层又一层的人群迁徙和混血事件,现代人群的遗传多态性模式就是这些复杂历史事件综合的结果。所以,单独研究现代人群的遗传多态性模式无法帮助我们还原复杂的历史,只有古DNA 可以帮助我们揭开历史一层又一层的面纱。

  内容简介:作者大卫·赖克是古人类DNA领域的世界级领跑者,哈佛医学院遗传学系教授。2013年到2018年,赖克的古DNA实验室生产了7 000多份古人类全基因组数据,占全世界总量的一半以上。作为古DNA革命的领头人,他义不容辞花费3年写出了《人类起源的故事》这本领域奠基之作,以古DNA这个非凡的视角,向读者提供了一幅迄今最清晰、最科学的人类迁徙、演化的历史画卷。

  

  [美]大卫·赖克著,叶凯雄、胡正飞译

  浙江人民出版社·湛庐文化,2019年

责任编辑:王超

科普中国APP 科普中国微信 科普中国微博
科普中国网
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢