一个汉字的国标码占用多少存储字节?-LMLPHP

汉字国标码,创建于1980年,目的为了使每个汉字有一个全国统一的代码而颁布了汉字编码的国家标准。每个汉字有个二进制编码,叫汉字国标码。 在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。

国标码又称为汉字交换码,是计算机之间交换汉字信息时使用的代码标准。国标码用两个字节来表示,即每个汉字使用2个字节表示。

GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(20H)。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而 GB2312最多能表示6763个汉字。

以上就是一个汉字的国标码占用多少存储字节?的详细内容,更多请关注Work网其它相关文章!

09-12 14:02