未标题-1.jpg

花1年只为订正1个单词:沉淀的"牛津词典"开始求变

网易科技 2018-03-15

  出品|网易科学人栏目组 晗冰

  据国外媒体报道,几个世纪以来,词典编纂者都试图捕捉整个英语语言的所有单词。而技术发展可能很快就会将这个梦想变为现实,但这会终结传统的词典吗?

  2009年2月,一位名为@popelizbet的推特用户向名叫科林的人提出了一个具有明显历史性的问题:她问科林是否能够对她“自以为是地解释”( mansplain)一个概念。,事实上,去年夏天发表mansplain这个词的词典编纂者伯纳德特佩顿(Bernadette Paton)相信这是第一次有人以可记录的形式使用这个词。 “它已被删除了,但我们抓住了它,”帕顿满意地告诉我。

  在牛津大学出版社的办公室里,帕顿正在为牛津英语词典《牛津英语词典》起草一个全新的条目。当我造访这里的时候,她的文件托盘上还有关于“雪花“(snowflake)等词条,这个略带有千禧年色彩的词来自于1983年的基督教文本(“你们都是一片雪花,没有两个人一样” You are a snowflake. There are no two of you alike)。在《牛津英语词典》编纂者的列表中,大约有30,000个这样的词条;而每年还会再增加7000个。 “每个人都认为我们很慢,但实际上处理的速度已经相当快了,”帕顿说,“虽然我们有一位同事确实花了一年的时间修改'去'(go)这个词”。

  听起来花费12个月的时间去追溯仅仅由两个字母组成的单词历史似乎非常愚蠢。但是,像牛津英语词典这样基于史实的字典编纂的目的就是赋予这种问题应有的庄严。作为牛津英语词典的编纂者,他们可能需要浏览十年前在Twitter的使用痕迹,亦或拼凑出堪称英语中最古老动词之一的词义变化(在英语中,go前前后后有多达537种不同的语义)。 “那么,我们必须把事情做好,” 牛津英语词典现任总编辑迈克尔·普罗菲特(Michael Proffitt)告诉我。

  从一个层面上讲,再没有东西比字典更简单的了:只是人们使用或已经使用的单词列表,并解释这些单词现在的含义或者是曾经的含义。然而,从另一个层面上讲——也就是词典编纂者烦恼和迷恋的层面——很少有事情会更复杂。谁使用过这些词,何时何地使用这些词?你如何知道的?其中还包括哪些词,以什么语义语境为基础?你如何从中辨明这个词的语义?到底什么是“英语”?

  对于像牛津英语词典这样的词典——其声称为公元1000年到现在的英语中的每一个单词提供一个“确定”记录——这个问题甚至更难回答:我们能否全面理解、调查和分析这种处于不断发展之中的活的语言?与词典编纂人员交谈会让人有些担心再使用“字面意思”这个词,但是对于一本明确的词典来说,实际上并没有所谓的字面意思。即便你到达了山顶,也会发现需要探索的内容又扩大了100英尺。然后你意识到它甚至不仅仅是一座山,而是地球上一系列连贯的山脉。 (在这个“英语全球化”的时代,这种比喻似乎很恰当。)

  尽管如此,正如作家西蒙温彻斯特(Simon Winchester)在其关于《牛津英语词典》历史的书中所描述的那样,对“一切语义”的追求已经吸引了几代词典编纂者。从维多利亚时代设立一个“委员会用于收集未登记英语单词“的发起者,到《牛津英语词典》第一位称职编辑,不知疲倦的詹姆斯默里(James Murray)都是如此。默里曾为第一版《牛津英语词典》的出版花费了长达36年的时间。打造一本完美英语字典的梦想可以追溯到启蒙运动时期,即通过对语言进行分类和规范,人们可以,也许是可能提炼出人类思想的本质。 1747年,塞缪尔约翰逊(Samuel Johnson)在他即将开始的英语词典“计划”中宣称,他将创造的不仅仅是“一本可以固定我们的语言发音的词典,也将促进英语的学术影响力;通过词典英语的纯粹性可以得到保存,用途被确定,并延长其持续时间“。词典使得英语不会仅按字母顺序排列,也将使得语言得以永久保存。

  在第一版出版后的第90年,比约翰逊词典更久远《牛津英语词典》目前正在进行第三版,这是一个涉及每个词条大修的浩大工程(其中许多词的语义要追溯到维多利亚时代晚期),并添加至少30,000个遗漏的单词,以及将词典完全数字化。原计划整个词典的修订工作将在2000年完成,然后推迟到2005年,然后又一次推迟到2010年。从那以后,牛津英语词典编纂委员会就不再提及完成日期。我问普罗菲特他们的进度。 “大约48%,”他回答。

  这本字典的权威性和存在意义毋庸置疑。20世纪80年代后期的某个时候,普罗菲特的前任主编约翰辛普森(John Simpson)曾向英籍牙买加作家及诗人本杰明·泽凡尼(Benjamin Zephaniah)请教名词“skanking”的原始语义。泽凡尼认为最合适的解释方法是到《牛津英语词典》总部进行面对面的交流。决定唯一解释的方法是到《牛津英语词典》总部进行私人的一对一表演。 Skanking正式被收录进《牛津英语词典》,被定义为“一种搭配雷鬼音乐的西部印度舞风格舞姿,腰部以上身体向前弯曲,同时膝盖向上抬起,双手顺势抓拍空气。”

  这个故事触及到了一些深刻的东西:在捕捉一个词时,可以就此观察和定义真实的生活体验。也就是说只要你能够理解所有的词,也许就可以定义真实存在。

  然而,第一批英文词典编纂者制作者对捕捉整个文化毫无幻想。汉语和古希腊语等语言相早在几千年前就存在系统的,字典式的作品,但相比之下最早的英语词汇直到16世纪才开始出现。英语词汇过于零碎,且继承了多种语言,堪称老盎格鲁日耳曼语,挪威语,拉丁语、希腊语,以及诺曼法语的混合体。

  这种杂交的语言已经足够令人困惑了。但在16世纪中叶,由于时局动荡以及殖民贸易引发的新一轮移民潮,英语变得越来越混乱。同期也带来了很多新词汇:诸如“酒精”( alcohol)诞生于1543年,源自阿拉伯文以及拉丁文;“放弃”( abandonment)诞生于1593年,来自法语。科学和医学的发展加剧了这种混乱。 1582年,理查德·马尔卡斯特(Richard Mulcaster)呼吁学者“将我们在英语中使用的所有词汇编成一本字典”。这样一来可以规范拼写,另外也最终建立“适于使用”的词汇规则。

  1604年,一位名为罗伯特·考德雷(Robert Cawdrey)的神职人员创造了一个临时解决方案:面向“女士、名媛淑女以及其他技能不熟练人”出版了单一语言的《字母表》(Table Alphabeticall),在其中列出了大约2,500个“较难使用的词汇”,这还不到当时常用语的5%。而且词义比较模糊,其中的“饮食”(diet)一词被描述为“进食的方式”,也没有任何解释性的引用,更不用说追溯语源了。《字母表》的词汇量非常少,甚至没有关于字母W的条目。

  图示:罗伯特·考德雷(Robert Cawdrey)于1604年出版的《字母表》

  词典编纂者一直在努力,但大多数时间的不断尝试都是徒劳。约翰·布鲁卡尔(John Bullokar)于1616年编纂的《词汇书》共有5000个单词,而亨利·科克兰(Henry Cockeram)在1623年编纂的《字典》有8000个单词,这也是第一次作者将自己的作品命名为“字典”。而托马斯·布朗特(Thomas Blount)在1656年编纂的字典有11000个单词。但似乎没有人能够用英语来捕捉“所有问题”,大家对于词义并没有达成一致。随着时间推移,英语的发展速度比以往更快。你到底该从哪里开始?

  这个时期,法语、意大利语以及西班牙语都已经出版了综合字典,但英语却没有。1664年,英国皇家学会组织成立了一个22人的“改进英语”委员会,仅仅召开了几次会议就宣告解散。 1712年,乔纳森斯威夫特(Jonathan Swift)针对这个问题发表了一番言论,对轻率使用英语的情况大加挞伐,坚持认为“应该考虑采用某种方法来明确和修复我们的语言” - 认为英语需要进行详实考证,英语使用者应该遵守一些规则。这个提议撼动了每个人。直到1746年,当一个出版商财团设法说服塞缪尔约翰逊(Samuel Johnson?)接受这个“伟大而艰巨的工作”时,英语综合字典的完成似乎值得期待了。

  约翰逊的词典最终在1755年完成,堪称壮举。他收集了43500多个单词,估计囊括了当时惯用词汇的80%。但在某些人看来,这不仅仅是编纂者的失败,也是一次英雄式的失败。与他1747年计划的自信满满和乐观主义相比,其在前言中关于“固定”和“保存”的谈话使得字典成为了一个纯粹的现实主义作品,。约翰逊解释说,驯服快速发展的生物(如英语)的想法不仅是不可能的,而且是荒唐可笑的:

  “我们往往会嘲笑那些夸口能让人活一千年的长生不老药,并且藉此平等的所谓正义驱使下,也会嘲笑那些从无到有创造的词典的编纂者,而这一词典是在不断变化中保存我们这个国度的语言。但是编纂者更乐于想象,他的字典保证他们的语言不会堕落和衰变,可以让它们被铭记于心。“

  正如约翰逊曾经幻想过的那样,词典编纂者可能会幻想捕捉和固定词汇的意义。然而,对于一种不断变化的语言来说,将永远不断超越原有内容。

  尽管如此,梦想仍在继续。如果一本词典能够囊括从有文字记录到现在为止的所有英语词汇呢?业界也提到了约翰逊词典的修订本或竞争对手的可能性,但事实上鲜有这种作品问世。1828年,一位名为诺亚韦伯斯特(Noah Webster)的美国康涅狄格州教师出版了第一本《美国英语词典》(其中包含7万个英语词汇)后,英国人的自豪感再次受到威胁。

  1857年11月,伦敦语言学会召开会议,听取威斯敏斯特院长理查德·切尼维克斯·特伦奇(Richard Chenevix Trench)所撰写的题为《关于我们英语词典中存在的一些缺陷》一文。这是一个重磅炸弹:特伦奇争辩说,英国英语词典是如此不可靠,以至于需要推倒重来。站在现有立场上,他简要介绍了关于“一本字典的真实想法”。这种柏拉图式的资源应该严格按照学术上的历史线索进行汇编,甚至要深入到古语源学语言的洞穴之中。它应该客观描述而不是硬性规定,对于从盎格鲁-撒克逊单音节词到最新的技术术语都应当秉持客观公正的态度。最重要的是,它应该是全面的,给予特伦奇所谓“我们的母语”以荣誉感。

  对语言整体性的追求可能已有数百年历史,但是,像一条伟大的铁路或重要桥梁一样,这本新字典将是彻底的维多利亚时代产物:科学态度,冒险精神,史诗般宏大和代价高昂。编纂这样一本字典完全是是爱国义务的使然。特伦奇坚持说:“字典是历史丰碑,是一个民族的历史”。

  在最初的二十年里,所谓的“新英语词典”看起来好像会走以前许多类似项目的老路。第一位总编辑在入职一年后离世,留下了一个烂摊子;第二个总编辑是一位女性,注意力完全没有在字典编纂上。事实上,直到牛津大学出版社在1879年说服一位小有名气的苏格兰教师和文学家詹姆斯默里(James Murray)担任主编后,新英语词典的编纂工作才开始走上正轨。

  图示:詹姆斯默里(James Murray)组织编纂了第一版《新英语词典》,于1928年出版

  默里的主旨思想是通过志愿者在报纸和图书馆书籍中寻找引语,以此来说明单词随着时间而变化的方式 - “语料库”将使字典尽可能准确。来自世界各地和各行各业的2000多名英语爱好者聚集了大约500万条词汇引语,为默里的词典编纂者团队提供了大量帮助,而编纂者们则一边翻阅字母表,一边界定词汇。即使一个单词的此以明确,相应工作都会花费很长时间,比预定的时间要长得多——项目正式实施五年之后,工作进度仍然处于字母A的一半——而默里督促着词典的编纂工作。“如果没有他,这是不可能的,”编剧以及《牛津英语词典》历史学家Peter Gilliver说。

  词典的第一部分于1884年出版,从A到Ant,并在接下来的40多年中定期结集出版。尽管默里于1915年去世——这时词典已经编纂到“Turndun”和“Tzirid”之间的某个地方——但相关编纂工作依然持续下去。 1928年这部词典的完整版终于问世:一共10卷,涵盖了约414,800个词条和短语,每个词都有一个定义,词源,此外共有180万条引用语,用于读者了解该词汇的使用情况。

  这是有史以来用现有语言编写的最大书籍之一:如果你把所使用的活字金属首尾相连,它将从伦敦延伸到曼彻斯特。这部词典的问世或许迟到了60年,但出版商最大程度地宣传“牛津字典是最高权威,没有竞争对手”。

  然而如果仔细研究一番,它的缺点也是显而易见的。1928年出版时,这个维多利亚时代的大部头已经过时了。A-C条目的词汇是在近50年前编制的;其他词汇依托的学识已经过时,特别是科技领域的词汇非常明显。在词典编纂者内部,人们也承认字典(M-Z)后半部分的质量要好于前面(A-L)。字母E相关的词汇被认为是特别差的。在其他缺陷中,默里反对“杏仁蛋白软糖”( marzipan)一次,宁可将它拼成了“碎杏仁制成的饼”( marchpane)。默里还认为不应该收录形容词“非洲的”( African),因为它不是一个单词。

  唯一的解决办法是对词典进行修订。 《牛津英语词典》的第一个增补版于1933年问世,收录了编辑在知识过渡期间发现到的新词以及原始遗漏问题。第二次增补于1957年开始,最终在1972年至1986年期间分四期出版,共计69,300多项新词条。然而,这似乎是一场失败的战斗,也算是芝诺悖论(Zeno's paradox)的一种特殊形式:《牛津英语词典》词典编纂者离终点线越近,终点线看起来就越远。

  与此同时,他们前进的方式有所改变。到了20世纪60年代后期,计算机主导的方法被称为“语料库语言学”,迫使词典编纂者重新审视他们对语言运作方式的深刻假设。它不是以旧式的方式制作字典——在已有的单词/定义列表中进行工作,并寻找证据证实你所认为的词义——语料库语言学则将过程放在首位:您使用数字技术来获得人们真正书写或说话的词汇,并据此编纂词典。第一部现代语料库是标准美国英语的布朗语料库,于1964年编纂,一共收录了100万字,其中包括浪漫主义小说,宗教短片以及当代“流行知识”和日常用语在内的500多个文本。其中的每一个来源都未被词典编纂者咨询过,语料库的体量也不可能被审核。事实上,当前为词典提供原材料的通用语言语料库包含数百亿字,超过了词典编辑最疯狂的想象。

  如何构建语料库并没有限制:去年在伯明翰举行的语料库语言学会议上,我看到研究人员会浏览大学Twitter用户的惯用语,也会通过分析英国法官的判决言论来梳理性别偏见的相关证据。

  对于词典编纂者来说,语料库语言学最让人兴奋的是它可以让你窥探非正规用语。整理出现特定词汇的短语可以让你解开这个词不同的意义。探究一个词是如何被“误用”的,暗示着它的重心可能在发生变化。例如,比较代表性的语料库可以让你看到特朗普支持者频繁地部署一个名词,比如说“自由”,以及这个词在Black Lives Matter运动中的用法有多不相同。 “这完全改变了我们所做的事情,”词典编纂者迈克尔·润德尔(Michael Rundell)告诉我,“这产生了自下而上的影响。你必须重新思考几乎所有的事情。“

  但是,尽管其他词典出版商推崇语料库语言学,但《牛津英语词典》的编辑们则坚持他们所了解的,抵制电脑化并依靠大学图书馆和研究人员提供的引用语进行编纂。在20世纪70年代和80年代,很少有人想到要彻底改变这最伟大的历史词典,更不用说让它保持最新状态:它的漏洞和原来一样多。当《牛津英语词典》第二版于1989年3月出版时——一共20卷,其中包含291,500个词条以及240万条引用语——有人抱怨说这根本不是真正的新版词典,只是一个换了排版的旧版词典。关于“计算机”( computer)的词条将其定义为“计算用机器;尤其是用于执行数学或逻辑运算的自动化电子设备“。这是从1897年的一本期刊中引用的。

  令人吃惊的巧合是,就在《牛津英语词典》第二版问世的当月,一条爆炸性消息撼动了世界:一位英国计算机科学家蒂姆·伯纳斯-李(Tim Berners-Lee)提出的“大型超文本数据库”的概念。这个称之为万维网的技术为词典化未来提供了一条闪亮道路。数据库可以共享,并相互连接;用户可以扫描整个图书馆,并可以检索其中的内容。人们使用电脑和调制解调器就可以获取所有现存的文本。

  随之而来的可能性令人目不暇接。在纽约客于1989年发表的一篇文章中,牛津大学出版社一位管理人员兴奋地说,如果词典能够与语料库语言学资源恰当结合,那么可以实现一些特殊的事情:“柏拉图式的概念 - 理想的数据库”。这正是《牛津英语词典》创编人特伦奇在132年前所提出的理想:一千年甚至更长时间内的每一个英语单词都被展现出来。

  事实上,现在可以从网上获得如此多的文本,这是最为剧烈的变化。现在已经讲过的单词现在在社交媒体上输入。俚语专家强纳森·葛林(Jonathon Green)说:“长期以来俚语词典专家一直梦想能够追踪词汇的不同使用形式。”现在,通过Facebook或Instagram,这实际上是可以实现的。词典编纂者几乎可以在词语诞生的那一刻发现:在此之前,编纂者针对诸如“mansplain”之类的词语将不得不寻找能够证实其存在的印刷记录。

  当《牛津英语词典》在19世纪50年代首次被构想时,英语是不列颠群岛、北美洲大部以及海外殖民地的官方语言。如今,世界上近四分之一的人口,也就是15亿人口把英语作为第二语言。英语也有许多区域性变体,从西印度群岛到西非再到威尔士都是如此。所有这些区域性英语比以往任何时候都有更加明显的特征,每种英语都以更大更快的速度互相交织。

  “英语圈有一个明确的中心,但没有明显的界限,”詹姆斯默里(James Murray)曾写道,但现代词典编纂者并不同意这一点。不是一个中心,而是有许多相交的区域,每个区域使用不同的英语,还受到地理背景或遗产,价值观,其他语言,以及几乎无法估量的变量影响。区域的变化比以往任何时候都快。如果如《牛津英语词典》词典编纂者所说,每年的确会出现约7,000个新单词,那么在你阅读这篇文章的时候,可能还会再出现两个新词。

  当然,大多数人现在从不使用词典。他们只需在维基百科上键入短语(比百科全书更常用,而不是百科全书,研究表明),或者依赖于谷歌搜索。谷歌通过与牛津英语词典的合作为用户提供词义,发音,词源,随时间的变化和翻译。如果你想知道一个词的含义,你可以对着智能音箱的Siri或Alexa上大喊一番。

  词典网站Dictionary.com的简萨洛蒙(Jane Solomon)指出,词典更新的速度太慢了。 “信息检索正在发生如此之快的变化,”她说,“为什么词典无法对语义或用户环境做出反应,比如弄清楚你正在寻找食物词汇,并且给你相关的词汇或食谱?”她认为词典展示的不仅仅是文字:“我喜欢表情符号,这非常有创意。表情符号已经成为一门完全独立的语言。人们有时需要解释;如果你给女儿发送茄子表情符号,她可能会觉得这很奇怪。”

  图示:出版于1928年的第一版《新英语词典》

  有些人的想法更大。其中一位是罗马Sapienza大学的计算机教授Roberto Navigli,他在2013年开发了一个名为Babelnet的网站,该网站的目标是成为击败所有现有词典的词典。这要归因于它并不是真正意义上的词典,其被称之为“语义网络”,可将现有资源(包括维基百科,维基词典和微软术语)汇集到一起,旨在创建一个不仅包含英语而且包含271种语言的全面层次化根映射,使其成为最大的词库和百科全书。 Navigli告诉我他的真正目标是使用“语义技术”为各地的软件工程师提供终极武器:自动化文本阅读器。 “这是梦想,对吧?”他说,“可以阅读文字并理解我们所说的一切的机器。”

  当然,机器已经理解了很多。有些人曾谈到了“文化经济学”,这是算词汇学的一种计形式,它使用语料库工具来分析和预测人类行为的趋势。一项为期31个月的Twitter用语研究试图衡量英国民众对紧缩政策的反应情绪。至少在大数据环境下,计算机和掌握数据的信息巨头可能比我们自己更能理解语言的本质。

  对于词典编纂者和谷歌之流来说,探究语言仍然存在固有的障碍。现在构建书面文本语料库,在特定环境中理解语言作用相对容易,但是关于口语的处理就要困难得多。原因很明显:录制语音,然后创建一个可用的数据库既费时又昂贵。语音语料库确实存在,但体量小且不具代表性。

  对于词典编纂者而言,发音是所有人最宝贵的资源,也是最难以捉摸的。如果你能够捕捉到大量样本——从操场,办公室食堂到超市,人们会在每一种可以想象到的环境中讲话——你就可以更加准确地监控人们日常使用语言的方式。 “如果我们破解了用于转录正常对话的技术,”迈克尔朗德尔(Michael Rundell)说,“它确实会改变游戏规则。”

  对于《牛津英语词典》的编辑们来说,这个世界既令人振奋又令人感觉有压迫感。数字时代使得牛津英语词典的编纂者能够获取关于该语言更深层次的信息,但它也有可能导致操作失误。当你制作一本历史词典并被要求审查每一种资源时,例如当审查关于17世纪手写体信件的相关信息时,信息量堪称噩梦。单词使用比以往更可见,变化速度要更快,相关信息也会以指数形式增加。 “在数字化的早期,我们有点失控,”彼得·吉利弗(Peter Gilliver)告诉我,“这是永无止境的,”一位《牛津英语词典》文字学家也同意这一点,“你可以感觉到自己正在掉入虫洞。”

  此外一个挑战让人难以理解:当越来越多的人更频繁地查阅类似于词典的资源时,几乎没有人愿意为此掏腰包。印刷版词典的销售已经濒临崩溃,这一形势远远超过其他行业。迈克尔·朗德尔(Michael Rundell)告诉我,牛津英语出版社拒绝给我提供相关数字,表示牵扯到“商业敏感性”。虽然实体参考书目的出版商纷纷合并或走到了尽头,但诸如谷歌和苹果等科技巨头却在通过搜索资源以售卖信息。对于用户来说,如果完全可以通过操作智能手机来查找词义,那为什么还要拿起一本书呢?

  “现在去词典学术会议,你会看到很多行外人,”朗德尔说。尽管他接受过词典编纂者的培训,但他现在主要担任顾问,为出版商提供建议,该如何使用基于语料库的资源。 “它曾经是一种职业,”他接着说,“但是30年前的工作并不是那么简单。”他指着他空无一物的架子,“但是,我对印刷业的凋零不是太伤感,我把大部分词典都带走了。“

  即使关于词典编排的基础设施已经完全失效或完全被改造,但有些东西仍保持着一致性。每一位与我交谈的词典编纂者都明确表达了对“单词爱好者”的厌恶,在词典界,所谓的单词爱好者对单词的解释不会多于十个词条,还常常向人卖弄自己读得出“世界上最长的英语单词”。一向对人和蔼可亲的约翰辛普森(John Simpson)毫不客气地指出:“我认为这种并不是在’享受’语言,而只是在使用语言。”

  或许人们最不愿承认是的,爱好才是让人们花费毕生精力去筛选和分析语言的主要原因。要成为“关于单词的侦探”需要特殊的才能:他们普遍是语言学学者,档案史学家,记者和传统侦探的综合体。尽管语料库语言学家与传统的词典编纂者相比,语料库语言学家和学术语源学家之间的矛盾还不是很大,但词典编纂似乎是一种特殊的专业的专业,参与的人们有着一种挥之不去的共同目标感:我们反对那种不断扩张的多头英语。英语。 “这是一种强迫症,”简·所罗门(Jane Solomon)如是指出。

  她继续说,大多数词典编纂者都知道,所谓制作完美语言资源的想法是非常愚蠢的。“我从过去的词典学了太多东西,以至于曾经把这个想法当作个人目标。”但是,成为词典编纂者的兴奋之处在于,他们知道这项工作永远不会完成。英语总是变形、发展、演变;不安分的活力让它是如此得引人入胜。“英语总是在变化,”所罗门说,“你必须喜欢它。”

  关于词典编纂还有其他的乐趣:捕捉到新释义的激动,或者创造出一个不完美、至少正确的定义。 “这听起来很俗气,但它可以像诗歌一样,”迈克尔·朗德尔(Michael Rundell)反思道, “编纂一本词典和其他手艺一样都是一门艺术。”

  尽管他对这个行业持悲观态度,但他对于自己即将加入的项目感到非常兴奋。他与来自澳大利亚土著语言中心的专家一起合作研究当地土著语言,其中不少专家都是词典编纂者。 “词典可以做出真正的改变,”他说,“它们可以为过去的偏门语言带来更多影响力;它们可以帮助保存和分享语言。我真的相信这一点。”

  在词典发展的整个过程中,《牛津英语词典》都在努力,想要比遗忘更完美地完成今天的任务。词典编纂团队现在更倾向于将其称为“移动文档”,只添加单词,但不会删除。他们永远不会被删除。我向迈克尔·普罗菲特(Michael Proffitt)说,现在的《牛津英语词典》就像一艘骄傲而又漏水的维多利亚式战舰,船员们试图在阻止其漏水,同时保证其安全,他看上去反应冷淡。“我过去常说,这就像在为福斯桥涂油漆,永无止境。但后来他们又停了下来——我想是有了一种新的油漆。”他停顿了一下,“但现在只有我们。”

  现在《牛津英语词典》每年在线更新四次;虽然《牛津英语词典》还没有正式放弃印刷版的想法,但这个想法正在消失。在我第一次问《牛津英语词典》进度的七个月后,我又问了一次;现在已经完成了48.7%。“我们会把它完成的,”普罗菲特坚持说,我想詹姆斯·默里(James Murray )可能会对此报以微笑。如果说此次再版确实需要到2037年才能完成,那么它的时间将会与第一版《牛津英语词典》所花费的49年相匹敌。

  几天前,我通过电子邮件查看“mansplain”是否已经被收录进《牛津英语词典》。虽然已经有了,但还是有一些障碍——更进一步的研究把这个词的起源向后回溯了六个月,从2009年2月倒推到了2008年8月。然后今年1月份帕顿公开结果时,就有人发邮件指出这样还是不准确:他们在2008年5月的一篇博客文章中发现了“mansplain”。普罗菲特向我保证,将尽快确定最新的词义。

责任编辑:sun

科普中国APP 科普中国微信 科普中国微博
网易科技
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢