简介
中国信息交换标准代码将是一种重新定义字节长度的信息模式,一个字节占用至少16位二进制,如果顺利的话,使用32位甚至64位也可以。
16位长度的字节,可以有 65536 种组合方式,能够将中文常用字全部包含进去,用作数决运算,将比传统的8位字节精确很多。
32位长度的字节,可以有 4294967296 种组合方式,能够将中文全部字全部包含进去,并且可以照顾当前大多数的CPU的运算能力。
64位长度的字节,可以有 18446744073709551616种组合方式,能够将人类全部的文字和声音包含进去,并为现在和将来的各种数据类型留足使用空间。
新的标准,兼容旧有的标准是很不难办到的,但是,改造人们习惯是困难的。软件的改造和标准的订立是相对容易的,但是,没有高效的硬件基础是不能发挥软件的最大能量。
与新标准相适应的输入设备还没有被开发出来。可能您现在使用的就是qwert键盘,它是为了不让机械时代的打字机卡壳而设计出来的,打英文就很低效,更别说是用于中文了。任何一种随机的组合都比这个好。
新的输入设备是让汉字进入计算机核心的硬件钥匙。它应该是一样能够自由定义键码内容和顺序的键盘,自带一个小容量的Flash存储器来存放对键位的设等和输入法程序。符合人机学的外观形态是必须的。
在最初的使用过程当中,大量的个性化的设置将出现。经过几年,甚至十几年的积累,最优化的输入设置将被自然优选出来,并成为被大量的生产固定模式。最高效的计算机控制器将由此产生。
汉字编码国家标准较常见的国家汉字标准代码列表
GB 2312 - 80信息交换用汉字编码字符集 基本集(又称为GB0)GB 13000 - 93信息技术 通用多八位编码字符集(UCS)第一部分GB 18030 - 2000信息技术 信息交换用汉字编码字符集 基本集的扩充其他中华人民共和国发布有关汉字标准代码列表:GB/T 12345 - 90信息交换用汉字编码字符集 第一辅助集(又称为GB1)GB/T 7589 - 87信息交换用汉字编码字符集 第二辅助集(又称为GB2)GB 13131 - 91信息交换用汉字编码字符集 第三辅助集(又称为GB3)GB/T 7590 - 87信息交换用汉字编码字符集 第四辅助集(又称为GB4)GB 13132 - 91信息交换用汉字编码字符集 第五辅助集(又称为GB5)GB/T 16500 - 1998信息交换用汉字编码字符集 第七辅助集国家推荐标准以 "/T" 来表示并非强制执行。由于GB 2312-80只收录了6763个汉字,未能覆盖繁体中文字、部分人名、方言、古汉语等方面出现的罕用字,所以发布了以上的辅助集。其中,GB/T 12345-90辅助集是GB 2312-80基本集的繁体字版本;GB 13131-91是GB/T 7589-87的繁体字版本;GB 13132-91是GB/T 7590-87的繁体字版本。而GB/T 16500-1998是繁体字版本,它并无对应的简体字版本。鉴于第二辅助集及第四辅助集,有不少汉字均是“类推简化汉字”,实用性不高,因而较少人采用。中华人民共和国国家标准总局于2000年推出强制性的GB 18030-2000标准。于2001年8月31日后发布或出厂的产品,必须符合GB 18030-2000的相关要求。1
相关标准列表(按首次出版时间排列)
标准号名称别名汉字数备注GB 2312-80信息交换用汉字编码字符集 基本集GB /GB06763GB 6345.1-86 等字模集有附录对 GB 2312-80 之修订,但 GB 2312 本身一直未有更新,详见 GB 2312 条目GB/T 7589-87信息交换用汉字编码字符集 第二辅助集GB27237向 ISO 10646 提交时使用繁体字版本GB/T 7590-87信息交换用汉字编码字符集 第四辅助集GB47039向 ISO 10646 提交时使用繁体字版本GB 8565.2-88信息处理文本通讯用编码字符集 第二部分无636主要用于电讯;GB2汉字520个、GB4汉字92个、来自《第一批异体字整理表》之异体字23个及“啰”字。此字符集补充了 GB 2312,使之能包括整个《现代汉语通用字表》GB/T 12345-90信息交换用汉字编码字符集 第一辅助集GB16866GB 2312 繁体版,增补103字GB 13131-91信息交换用汉字编码字符集 第三辅助集GB37237GB/T 7589 繁体版GB 13132-91信息交换用汉字编码字符集 第五辅助集GB57039GB/T 7590 繁体版ISO-IR-165通讯用中文多字节字符集 8464集合 GB 2312-80(包括 GB 6345.1-86 新增之字符及调整)及 GB 8565.2-88GB 13000.1-93信息技术 通用多八位编码字符集(UCS)第一部分 20902另有302个兼容汉字(当中十二个:U+FA0E, U+FA0F, U+FA11, U+FA13, U+FA14, U+FA1F, U+FA21, U+FA23, U+FA24, U+FA27, U+FA28 及 U+FA29 有独立形音义,统一码联盟建议不要视之为兼容汉字GBK汉字扩展内码规范 21003除了来自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21个兼容汉字(包括上述十二个有独立形音义兼容字),以方便和 Big5、CNS11643、JIS 及 IBM 文件双向转换、未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个;后80字暂时对应 Unicode 编码之私人使用区(Private Use Area),新版 Unicode 已全部收纳。Microsoft Code Page 936 收入21个兼容汉字,未收后80字GB/T 15564-1995图文电视广播用汉字编码字符集 香港子集 111所有字皆来自 GB 13000.1GB/T 16500-1998信息交换用汉字编码字符集 第七辅助集 3778其他 GB 未收录之 GB13000.1 汉字GB 18030-2005信息技术 中文编码字符集 70244首版本 GB 18030-2000