版权归原作者所有,如有侵权,请联系我们

[科普中国]-语言代码

科学百科
原创
科学百科为用户提供权威科普内容,打造知识科普阵地
收藏

语言代码(或语言编码)是一组用来代表语言的代码。语言代码是由字母或数字组成的短字符串,用于分类图书馆典藏、计算机程序上的本地化和翻译等用途。

语言代码标准ISO 639

ISO 639-1

ISO 639-2

ISO 639-3

SIL代号

万维网联盟的IETF语言标签1

ISO 639ISO 639是国际标准化组织为各语言所订定的语言代码。ISO 639的标题是Codes for the representation of names of languages(表示语言名称的代码),分为六个部分。2

|| || 表1

ISO 639-1ISO 639-1是国际标准化组织ISO 639语言代码标准的第一部分。它含有 184 个两字母的编码,用来标示世界上主要的语言。这些代码在很多地方都被用作语言的简写,例如:

英语(English)用en表示。

德语(Deutsch)用de表示(Deutsch是德语的本名)。

日语(Japanese)用ja表示(尽管日语的拼音是Nihongo)。

汉语使用zh表示,来自“中文”的汉语拼音:Zhōngwén。

ISO 639-1在 2002年成为正式标准,但在之前的草拟阶段已被使用多年。最后加进ISO 639-1的代码是在2004年10月19日加入的si,代表僧加罗语。由1995年3月起,RFC 1766推荐使用本标准,而接着在2001年1月起的RFC 3066亦推荐使用本标准。2

|| || 表2.ISO 639-1语言列表

ISO 639-2ISO 639-2:1998 是国际标准化组织ISO 639语言编码标准的第二部分,为各语言和语系所订定的 3 字母语言代码。 ISO639-2 的注册机构是美国国会图书馆。

有 22 种语言同时在 ISO 639-2 中有两个 3 字母语言代码:

ISO 639-2/B ,书籍目录使用 (bibliographic use)。

ISO 639-2/T ,技术专门使用 (terminological use)。

这 22 种语言本身都已有ISO 639-1编码。

ISO 639-2/B 是原本供书籍使用的代码,采用英语的语言名称排列,而并非使用该语言的语言名称排列。例如德语的 ISO 639-2/B 码是ger, ISO 639-2/T 码是deu;中文(汉语)的 ISO639-2/B 码是chi, ISO639-2/T 码是zho。除英语图书馆编排外,应使用 ISO639-2/T 码。

塞尔维亚语曾用 ISO639-2/B 码scc、克罗地亚语曾用 ISO639-2/B 码scr,但在2008年6月28日的改动中,已被停止使用,改为统一使用 ISO639-2/T 码srp和hrv。3

ISO 639-3ISO 639-3是个国际语种代号标准,在2007年2月5日出版。它延伸了ISO 639-2里的 Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是ISO 639-1的超集合。 ISO 639-3 是ISO 639-2个别语言的超集合,但是因为 ISO639-3 没有 ISO639-2 的语言集合,所以 ISO 639-3 不是整个 ISO 639-2 的超集合。

自2005年7月30日发布的计划草案,共有 7,602 个语言条目,这些语言的来源有三个:基本资料来自 ISO 639-2 所收录的个别语言,和取自《民族语》里的现代语言调查资料。3

本词条内容贡献者为:

杜强 - 高级工程师 - 中国科学院工程热物理研究所