版权归原作者所有,如有侵权,请联系我们

[科普中国]-语义图模型

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

关键概念概念空间

概念空间是通过跨语言比较建立起来的普遍的语义空间,是语言中特定编码形式(语法语素、语法范畴、句法结构及词汇形式)的不同功能及其相似关系构成的几何性概念网络。概念空间由节点和连线两部分组成;节点代表不同语言中对应或相关语法形式的不同功能,连线表示两个功能之间的直接关联。图是Haspelmath( 2003) 构建的与格功能的概念空间。概念空间的构型( configuration) 体现于不同功能在概念网络中的空间位置及连接方式。语义图模型假设, 概念间中不同功能的区域位置及连接方式具有跨语言的普遍性( Haspelmath 2003: 217— 8):任何语言的对应或相关语素所具有的功能均应在特定概念空间内占有某个区域位置,换言之,所有语言都是将其相关编码形式的不同功能映射到同一概念空间之上。另一方面,任何语言中相关的多功能语素,其功能之间的关联模式均应符合这个概念空间的构型。2

语义图与概念空间不同,语义图是针对特定语言的,它是特定语言相关编码形式的多功能模式在概念空间上的实际表征,体现的是不同语言对同一概念空间的不同切割方式。比如英语的介词to 具有“方向”(Zhangsan went to America as a student)、“接受者”(Zhangsan gave the apple to Lisi)、“经验者”(This seems outrageous to me)和“目的”(I left the party early to get home in time)等标记功能, 但缺乏“谓语性领有者”(predicative possessor) 、“受惠者”(beneficiary)、“外位领有者”( external possessor)以及“判决者与格”(judicantis)”等标记功能。另一方面,法语的与格介词à 也具有“方向”(à Leipzig)、“接受者”(à Adam)和“经验者”三种标记功能,二者的区别是法语à 不具有“目的”功能,但可以表达“谓语性领有者”功能(Ce chien est à moi. “This dog is mine. ”)。据此,我们可以在图的概念空间上绘出英语to 和法语à 的语义图:

由图可以看出,英语to 和法语à 在与格概念空间上切割方式和功能界域虽有不同,但二者的功能关联模式并未逸出与格概念空间的制约。可见语义图和概念空间之间的关系是;概念空间提供人类语言多功能语素在语义关联模式上的变异范围和普遍制约;语义图则表征不同语言对应或相关的多功能语素在语义关联模式上的变异类型。换言之,概念空间表征的是人类语言的普遍特征,语义图刻画的是不同语言的变异模式。1

邻接性要求概念空间的一个重要特性是,多功能形式的不同功能在概念空间中的位置必须是毗连的。反映在具体语义图上则是:任何一个语言中相关编码形式的若干功能必须占据概念空间内的一个邻接区域。比如图中英语to和法语à 的四项功能均彼此邻接,各自占据一个连续的区域。vander Auwera(van der Auwera and Plungian 1998; van der Auwera and Temürcu 2006)和Haspelmath(1997a,1997b,2003)将这种制约概括为“邻接性要求”,Croft(2001:96,2003:134)则表述为“语义图连续性假设”。1

运用及其成果语义图模型最早可追溯到1980 年代Anderson( 1982,1986) 的系列研究,经过中间数年的相对沉寂,降至1990 年代中后期,语义图模型在语言类型学领域逐渐受到关注并取得令人瞩目的丰硕成果,标志着语义图模型渐次走向成熟。这些成果的核心研究领域包括体 、反身和中动态、不及物谓语 、不定代词、时间状语、状语从属、

情态、语义角色、语气、并列结构以及转折和对比标记等。其中Haspelmath(1997b) 首次明确对“语义图模型”的具体运用做了详细深入的阐述,而Croft(2001,2003)将表征特定语言变异类型的“语义图”和人类认知普遍具有的“概念空间”联系起来,从而进一步推动语义图模型的研究。2011来,Croft 等学者开始引入“多维量表”( MultidimensionalScaling,MDS) 进行研究,代表性的成果有Clancy( 2006) 、Cysouw( 2007) 以及Croft 和Poole( 2008a,2008b) 。不过,由于这些成果本身尚有争议,下面只选取采用MDS 之前的几种代表性成果,集中展示“传统语义图模型”在语义角色、不定代词以及反身标记这三个领域的具体运用及其成果。1

语义角色: 工具及相关功能前置词和格标记是典型的多功能语法成分,它们常用来标记“工具”、“伴随”、接受者”等语义角色。根据相关研究成果,对语言中前置词和格标记的多种功能做了综合考察,构建了“工具及相关功能”的普遍概念空间 ,并据此绘出英语with、德语von /aus、法语par 等语法形式的语义图。1

经典之作: 不定代词语义图堪称语义图研究中最为经典的成果,它引发了类型学界对语义图模型的广泛关注 。该书在语言取样、功能选定、图形绘制以及分析解释等方面成为后来同类研究的典范。作者深入考察了40 种语言( 外加100 种其他语言以扩充考察的广度) ,发现不同语言的不定代词在9 种功能上具有不同的映射方式。但是,不同语言中不定代词的功能映射具有严格的制约,因此,作者首先构建了包含9 种功能的普遍的“概念空间”,然后使用“语义图”来表征这些制约。图是不定代词的“概念空间”,Haspelmath 称之为“蕴涵图”图。1

功用和价值如前所述,语义图模型是研究多功能语法形式特别是多功能语法语素的重要视角,那么这种研究模型跟以往的研究方法相比,它有哪些功用和价值呢?

直观地呈现不同功能之间的亲疏远近关系,语法形式的多功能性是语言的本质特征。传统上对于多功能语法形式的分析往往采用“罗列法”,即将一个语法形式的各种用法或意义简单地罗列在一起并贴上不同的标签。这种方法的最大缺陷是不能反映多功能语法形式不同功能之间的内在联系,也就是说,它无法说明,一个多功能语素所具有的若干意义或功能之间,哪些关系较近,哪些关系较远。跟罗列法不同,语义图研究模型在构建概念空间时根据意义的相似程度来确定不同功能的空间位置和连接方式,因此概念空间的构型可以非常直观地表征多功能语素不同功能之间的远近亲疏关系:位置邻接且有连线相连的功能关系较近,属于直接关联; 反之,位置间隔较远或无连线连接的功能,关系较远,属于间接关联。比如在与格功能概念空间内,“接受者”与“方向、受惠者、经验者”等功能位置邻接且有连线相连,因此“接受者”分别与这些功能关系密切,属于直接关联; 反之,“接受者”与“判决者与格、目的”等功能位置不相邻接且无连线相连,因此这三个功能之间关系较远,属于间接关联。

有助于多功能语法形式的跨语言比较,在语义图模型中,概念空间是基于跨语言资料通过归纳法构建而成的,不过,一旦所构建的概念空间被认为是正确的,那么这个概念空间就成为跨语言比较的重要工具:概念空间
的构型反映了特定概念域中人类语言多功能语素在语义关联模式上的变异范围和普遍制约,而概念空间中的各项功能则是语言变异的最小成分以及跨语言比较的基本单位;我们只要将不同语言中相关语法形式的功能映射到特定概念空间并绘出相关语言的语义图,那么不同语言之间功能关联模式的相似性和差异性就得到直观而清晰地揭示。比如英语的to、法语的à和古汉语的“于”虽然都是与格标记,但各自的多功能模式相似而不等同。一旦我们将这些语法标记的不同功能投射到图1 的与格概念空间,这三个语法标记多功能模式的相似性和差异性就“昭然若揭焉”:它们的相似性是共有“方向、接受者、经验者”三个功能,而差异在于英语to 具有“目的”功能但缺少“谓语性领有者”,与之相反,法语à 有“谓语性领有者”功能而没有“目的”功能;另一方面,古汉语“于”跟英语to 和法语à 的差别在于,“于”具有受惠者”功能但不表达“目的”和“谓语性领有者”功能。

对人类语言中语法形式的多功能模式做出限制,人类语言中语法形式的多功能模式表面看来变化莫测,其实“万变不离其宗”,这种差异性的背后有着显著的规律性。语义图模型可以通过概念空间和邻接性要求对人类语言中语法形式多功能模式的变异范围做出限制。

对多功能语法形式的演化方向做出预测如前所述,概念空间及语义图体现了不同功能之间的蕴涵关系,据此可产生一系列蕴涵共性。但这种共时蕴涵关系也可以有历时的解读,这就是概念空间及其蕴涵共性的动态化:不同功能之间的共时蕴涵关系意味着某个( 些) 功能的存在先设( presuppose) 另一个( 些) 功能的存在;历时地解读,则为某个( 些) 功能的演化先设另一个( 些) 功能的演化。比如根据邻接性要求,概念空间可以对A、B、C、D 四种功能之间的蕴含关系做出各种预测:如果一个语言的多功能语素具有A、C 两种功能,那么该语素同样具有功能D 或功能B; 如果一个语言的多功能语素具有B、D 两种功能,那么该语素同样具有功能C 或功能A。1

发展及展望跟任何研究方法一样,语义图模型也有其自身的局限性,我们没有任何理由指望它能解决所有问题。最近一些学者( Wlchli 2007,Cysouw 2008) 指出,语义图模型忽略了频率差异,一个多功能范畴的某种扩展是出现一次还是百次,在语义图的分析框架里均等量齐观。Clancy( 2006) 、Croft 和Poole( 2008a) 也批评说,在传统语义图模型里,概念空间虽然能有效表征范畴之间的联系,但范畴之间的具体布局安排和空间距离缺少理论意义。概念空间上的节点( 功能) 都很少( Haspelmath 1997b 只有9 个功能,van der Auwera 和Plungian 1998 只有8 个核心功能) ,这样不可能扩大分析。手工绘制比较费力,一旦遇到更多数据,手工就难以胜任。此外,它也无法处理例外,即无法衡量某个概念空间与大量跨语言数据的适合度。更麻烦的是,语义图本身不是形式化的数学模型,是图表结构而非欧几里得模型。

与此同时,Croft 和Poole、Clancy、Cysouw 等学者开始尝试用MDS 取而代之。Croft 和Poole( 2008a) 利用MDS 尤其是Poole 设计的“最优分类非参数展平算法”分析了“不定代词”和“时体系统”等语言实例,为语言学家从十分复杂的大范围语料中推导语言共性提供了一个有力的形式化工具。此后,利用MDS,Clancy( 2006) 分析了斯拉夫语的格范畴,Cysouw( 2007) 分析了“人称标记”范畴。正如Clancy( 2006) 所指出的,MDS 与传统语义图的相似之处在于它们都对一系列功能的相似性做出空间表征,但MDS 的优越性在于引进了“定量语义距离”的观念和精确的几何布局,对传统语义图的诸多不足做了极大改进。Clancy( 2006) 甚至认为MDS 对传统语义图进行了一次革命。1