语音里的历史地图(下)
作者:猫狞科普
上一篇我们提到了“系列奠基人效应”,即少数移民的基因频率决定了新族群的基因频率。十里不同音的语言,是否也有“系列奠基人效应”的影响呢?
阿特金森使用了马克斯·普朗克数字图书馆维护的“语言结构世界地图”(The World Atlas of Language Structures)数据。这一数据包含了世界各地语言学家提供的关于各种语言的资料。他们将过去几十年甚至更久的研究成果编制成数据集发布在网上,供全世界的学者使用。阿特金森的发现就建立在对这组数据中语音地图的研究上。
语言流变之中,词汇的变化十分剧烈,难以做长时程的追踪,而语音的变化速度则比较稳定,很有可能是一个像基因一样的好标记。在语音结构世界地图中,有504种语言的原音、辅音和声调记录。其中,每种语言的原音被分为少(2-4种),中(5-6种)和多(7-14种);辅音被分为少(6-14种),略小(15-18种),中(19-25)略大 (26-33种),大(34种以上);声调系统则是按照无声调,简单声调和复杂声调来划分的。阿特金森将语音系统的复杂度、说这种语言的人口数量,和与非洲的距离做了分析,发现越是远离非洲地区的语言,语音系统多样性就越发贫乏。而排序一下就会发现,整体上语音多样性最为复杂的地区是非洲,其次是差别不大的亚洲和欧洲,然后是北美洲,南美洲倒数第二,最后是人类到达最晚近的大洋洲。这种越是离开非洲,语音多样性越简单的现象,和人类基因多样性的情况非常接近。由此,阿特金森认为,人类起源于西非,并分布到全世界。在我们的语言中,也保留着一幅人类走出非洲的历史地图。这一研究发表在2011年的《科学》(Science)上,题为《语音多样性支持了语言自非洲扩散的系列奠基人效应模型》(Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa)。通常被认为是人文科学的语言学,一下借用了分子生物学和体质人类学的研究成功,去确认人类祖先的起源了。
#争鸣
阿特金森并非突发奇想涉足语言,早在2003年他还是博士生时就用来自生物学的方法处理语言学问题。那一次,他用基因研究中常用的方法,重新绘制了印欧语系从阿纳托利亚高原向各地扩散的“语言树”。这篇论文倍受争议。2011年,俄亥俄的大学的教授布里安·约瑟夫(Brian D. Joseph)在接受《纽约时报》采访时表示,语言学者很难接受这样一篇用难以理解的生物学数学模型处理语言材料的论文。但这一次,也许大家会倾向于接受阿特金森的研究,因为他的结果和之前语言学的结果比较吻合。
正如约瑟夫教授提到的,非洲语言的语音多样性确实非常惊人,例如科伊人和桑人所说的语言就以复杂的语音系统著称。多年前有一部影片《上帝也疯狂》,片中的桑人甚至有舌头叩击上颚的奇怪声音。但是阿特金森也表示,这种具体到某种语言的证据,就不是他的方法能够涉及的了。
新的这篇论文发表后,迅速得到了学术界的关注。宾夕法尼亚大学的教授唐纳德·林格(Donald A. Ringe)就向《纽约时报》表示,现在确认阿特金森的正确还为时尚早,但如果这篇论文能经得起考验,则实在是他十年来读过的最有趣的文章之一。
同时善用数学方法的语言学者也发表了自己的结果。来自路德维格·马克西米连大学(Ludwig Maximilian University)的麦克·赛索教授(Michael Cysouw)等人,独立学者罗利·凡·图伊(Rory Van Tuyl)等人重新绘制了人类语言扩散的地图。复旦大学的人类学博士生王传超等,则使用了另一套数据,认为人类语言的扩散中心在里海南岸。
对此,阿特金森回应,赛索教授的研究,重新对人口数据赋予权重后,依然支持非洲起源说,而王的数据如果去除了吴语方言等几个极端值,也是支持非洲起源的。同时,阿特金森也指出,想进一步确认这一理论,需要更确切的获得标准化的语音数据,而现在,赛索和王的工作已经在继续这一探索了。
阿特金森的学术背景是生物学和心理学,不免让一些语言学背景的学者感到不屑。然而,利用国际合作造就的大数据资料,利用数学方法,跨学科的看待科学问题,这可能是未来科学发展的重要路径。从2003年发表到2012年被重新讨论,阿特金森关于印欧语系的起源的论文经历了十年,获得了更多的承认。而这一次通过语言数据确认人类起源的工作,则也许需要更长的时间,更多的学者投入智力。来自世界各地,十里不同音的人们,用一套方法,可以共同去寻找自己的祖先,这本身就是一件有趣的事情吧。
文章由科普中国-星空计划(创作培育)出品,转载请注明来源