汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,这就解决了与西文字符的ASCII码冲突的问题
汉字编码用两个字节进行编码,每个字节的最高位为0,这就是国标码。但如果就这样放入电脑,就会与一个字节的ASCII冲突。为此,规定放入机器时每个字节的最高位都置为1,这就是机内码。
可以将机内码看作是国标码的变形。它们的区别就是每个字节的最高位是否为1。
在我国汉字代码标准GB2312-80中有6763个常用汉字规定了二进制编码。
每个汉字使用2个字节。
GB2312-80 GB2312将代码表分为94个区,对应第一字节;每个区94个位,对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。01-09区为符号、数字区,16-87区为汉字区,10-15区、88-94区是有待进一步标准化的空白区。GB2312将收录的汉字分成两级:第一级是常用汉字计 3755个,置于16-55区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87区,按部首/笔画顺序排列。故而 GB2312最多能表示6763个汉字。
汉字有好几千,一个字节只能表示到256
数量 比划 字体