汉字区位码是为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。
国际码=区位码+2020H,汉字机内码=国际码+8080H。首先将区位码转换成国际码,然后将国际码加上8080H,即得机内码。
汉字区位码在上世纪七八十年代起到了很大的作用,解决了六千多个汉字在DOS操作系统的汉字输入问题。现在,特别是2013年8月19日国务院颁布实施8105个通用规范汉字之后,便不再被人们使用。
相关信息
为了使每一个汉字有一个全国统一的代码,1980年,我国颁布了第一个汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。由于国标码是四位十六进制,为了便于交流,大家常用的是四位十进制的区位码。
一般换算全部用十六进制。机内码、国际码是十六进制的,区位码是十进制的。具体换算步骤:(H表示十六进制,D表示十进制)
1、将四位数的区位码分为两部分,两位数一组。
2、将这两个两位数换算为十六进制,运用公式进行计算。
国际码=区位码(十六进制)+2020H
机内码=国际码+8080H
例如:某汉字的区位码是2534。则25D=19H,34D=22H
则国际码=1922H+2020H=3952H,机内码=3952H+8080H=B9D2H
扩展资料
区位码、国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。
国标码是基础,指国家标准汉字编码。即《信息交换用汉字编码字符集(基本集)》,简称GB-2312。该字符集有汉字6763个。设有94个区,每个区94个位。每个汉字有一个固定的区位。
区位码与国标码的区别在于,在GB-2312中预留了一些空位,便于补充和扩展,经过扩展的区位码字符数量及范围就超过了GB-2312。而且台湾、香港、及日韩也是用区位码的,但其区位号与大陆用的就完全不相同。
机内码是为了避免ASCII码和国标码同时使用时产生两义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。
参考资料来源:百度百科-机内码
参考资料来源:百度百科-国标码
参考资料来源:百度百科-区位码
区位码与国标码转换步骤如下:
1、区码与位码分别转换成十六进制数表示;
2、区位码的十六进制表示+2020H=国标码。
以具字为例,具字的区位码为:3063
1、将30转换成16进制表示为:1E,63转换成16进制表示为:3F,区位码十六进制数表示为:1E3FH
2、1E3FH+2020H=3E5FH
所以具字的国标码为:3E5FH
区位码的使用方法:
在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字。
用区位码还可以输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。
扩展资料:
编码规则
01-09区为特殊符号
10-15区为用户自定义符号区(未编码)
16-55区为一级汉字,按拼音排序
56-87区为二级汉字,按部首/笔画排序
88-94区为用户自定义汉字区(未编码)
国标码
高位字节=(21)(十进制)+20H(十六进制)=15H+20H=35H
低位字节=(34)(十进制)+20H(十六进制)=22H+20H=42H
参考资料来源:百度百科-区位码
(1)区位码先转换成十六进制数表示;
(2)(区位码的十六进制表示)+2020H=国标码;
(3)国标码+8080H=机内码
举例:以汉字“大”为例,“大”字的区内码为2083
解:1、区号为20,位号为83
2、将区位号2083转换为十六进制表示为1453H
3、1453H+2020H=3473H,得到国标码3473H
4、3473H+8080H=B4F3H,得到机内码为B4F3H
扩展资料:
区位码的使用方法:
在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字。
用区位码还可以输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列), 在区位码汉字输入方法中,汉字编码无重码。
参考资料来源:百度百科-汉字国标码
参考资料来源:百度百科-区位码
汉字区位码是为每个汉字编一个唯一的代码,以便计算机辨认、接收和处理。区位码是一个四位的十进制数,对应着一个唯一的汉字或符号。
十进制的每个数码由4位二进制数码表示,称为BCD码,即“二一十进制编码”。常用的BCD码是8421-BCD编码,采用4位二进制数来表示1位十进制数,自左至右每一个二进制位对应的位权是8、4、2、1。
具体说明
通常,在DOS下的各汉字系统中,同时按Alt键和F1键即可调用区位码输入方法。而在Windows中常用Ctrl+空格键和Ctrl+Shift键调出区位码。
如“2901”代表“健”字,“4582”代表“万”字,“8150”代表“楮”字,这些都是汉字,用区位码还可以很轻松地输入特殊符号,比如,“0189”代表“※”(符号),“0528”代表“ゼ”(日本语),“0711”代表“Й”(俄文),“0949”代表“┭”(制表符)。
在区位码中,01-09区为特殊字符,10-55区为一级汉字(3755个最常用的汉字,按拼音字母的次序排列),56-87区为二级汉字(3008个汉字,按部首次序排列)。
在区位码汉字输入方法中,汉字编码无重码,在熟练掌握汉字的区位码后,录入汉字的速度是很快的,但若想记忆住全部区位码是相当困难的,常使用于录入特殊符号,如制表符、希腊字母等,这里简单介绍几个区。
本文发布于:2023-02-28 18:46:00,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/zhishi/a/167758320843888.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文word下载地址:区位码(区位码和国标码的转换).doc
本文 PDF 下载地址:区位码(区位码和国标码的转换).pdf
留言与评论(共有 0 条评论) |