机内码和国标码都占两字节,而机内码和国标码的区别在于机内码的每个字节的最高位是1,而国标码的每个字节的最高位为0.
"国" 字的十六进制编码为397A,那么其机内码就为397AH+8080H=B9FA
汉字在计算机内部其内码是唯一的。因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。
国标码的机内码为二字节长的代码,它是在相应国标码的每个字节最高位上加“1”,即
汉字机内码=汉字国标码+8080H
例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。
汉字机内码的基础是汉字国标码。
机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
举例:机内码位BEDF,求区位码?
有两种解法:1.BEDFH-A0A0H=1E3FH=3063D;
2.BEDFH-8080H=3E5FH(国标码),3E5FH-2020H=1E3FH=3063D.
国标GB2312–80中,"国" 字的十六进制编码为397A,其对应的汉字机内码为( )
正如你所写,规则是:
机内码=国标码+8080H。
实际上,很简单,就是将对应的第15位和第7位置1即可。
3的十六进制码是0011,最高位置1,即变为1011,用十六进制表达就是B。
7的十六进制码是0111,最高位置1,即变为1111,用十六进制表达就是F。
所以,机内码就等于B9FA。