Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >汉字机内码简介及转换工具

汉字机内码简介及转换工具

作者头像
电子工程师成长日记
发布于 2022-07-21 08:07:19
发布于 2022-07-21 08:07:19
6.1K0
举报

汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。

具体解释

因为汉字处理系统要保证中西文的兼容,当系统中同时存在ASCII码和汉字国标码时,将会产生二义性。例如:有两个字节的内容为30H和21H,它既可表示汉字“啊”的国标码,又可表示西文“0”和“!”的ASCII码。为此,汉字机内码应对国标码加以适当处理和变换。

汉字机内码=汉字国标码+8080H

例如,上述“啊”字的国标码是3021H,其汉字机内码则是B0A1H。

汉字机内码的基础是汉字国标码。

机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。

汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加2020H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。

利用“汉字机内码获取工具”可获得所有汉字的机内码,例如,“啊”字的汉字机内码如图所示。

再利用“汉字机内码获取工具”获取“我爱中国”几个字的汉字机内码如图所示。

“汉字机内码获取工具”百度云下载链接:

链接:https://pan.baidu.com/s/1y0nYgMYSqv7UmKD7EMLJkg

提取码:quwu

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 电子工程师成长日记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系
GB2312、GBK、GB18030等GB类汉字编码方案的具体实现方式是怎样的?区位码是什么?国标码是什么?内码、外码、字形码又是什么意思?它们是如何转换的,又为什么要这样转换?
笨笨阿林
2022/05/09
4.3K0
刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系
字符编码技术专题(五):前端必读的计算机字符编码知识入门
以上这些问题都涉及到计算机中*础的知识点——字符集及字符编码的概念,本篇将从前端开发人员的视解,让你彻底搞清并理解这些问题的本质。
JackJiang
2023/09/28
4350
字符编码技术专题(五):前端必读的计算机字符编码知识入门
计算机组成原理-计数制与定点数编码
设r进制数从左到右分别为 R(n) R(n-1) R(n-2) … R(1) R(0),则该进制数转换为十进制是
DearXuan
2022/03/22
1.2K0
计算机组成原理-计数制与定点数编码
数据存储和内存对齐
在ASCII码中,通过一个65的偏移量,使得一部分无符号数指向A-Za-z。 在C语言中,通过char类型的转换规范,可以将对应的01序列转换为英文输出。
WuShF
2023/11/16
2520
数据存储和内存对齐
【自己动手画CPU】计算机数据表示
(1) 掌握汉字机内码、区位码,最终利用相关工具批量获取一段文字的 GB2312 机内码,并利用简单电路实现 GB2312 编码与区位码的转换;
SarPro
2024/02/20
6080
【自己动手画CPU】计算机数据表示
刨根究底字符编码之五——简体汉字编码方案(GB2312、GBK、GB18030、GB13000)以及全角、半角、CJK
英文字母再加一些其他标点字符之类的也不会超过256个,用一个字节来表示一个字符就足够了(2^8 = 256)。但其他一些文字不止这么多字符,比如中文中的汉字就多达10多万个,一个字节只能表示256个字符,肯定是不够的,因此只能使用多个字节来表示一个字符。
笨笨阿林
2022/05/09
4.4K0
刨根究底字符编码之五——简体汉字编码方案(GB2312、GBK、GB18030、GB13000)以及全角、半角、CJK
刨根究底字符编码之零——前言
字符编码是计算机世界里最基础、最重要的一个主题之一。不过,在计算机教材中却往往浮光掠影般地草草带过,甚至连一本专门进行深入介绍的著作都找不到(对这一点我一直很困惑,为什么就没有哪位大牛对这个如此基础、重要而又如此容易让人困惑的主题写一本专著予以介绍呢)。
笨笨阿林
2019/01/18
5640
python encode和decode函数说明[通俗易懂]
如上面代码,str\str1\str2均为字符串类型(str),给字符串操作带来较大的复杂性。
全栈程序员站长
2022/09/07
1.5K0
字符编码详解及由来
真空管时代的计算机尽管已经步入了现代计算机的范畴,但其体积之大、能耗之高、故障之多、价格之贵大大制约了它的普及应用。直到1947年,由Bell实验室的William B. Shockley、 John Bardeen和Walter H. Brattain.发明了晶体管,开辟了电子时代新纪元,电子计算机也找到了腾飞的起点,一发而不可收……
黄规速
2022/04/14
9550
字符编码详解及由来
1.3 数字化信息编码与数据表示 计算机专业理论基础知识要点整理
1.不同进制之间无法进行大小比较,必须转为同一个进制才能比,一般比较的时候都转为十进制。
刘金玉编程
2021/06/21
1.1K0
1.3 数字化信息编码与数据表示 计算机专业理论基础知识要点整理
java获取所输入汉字拼音的首字母
问题:但用android调用getFirstLetter()方法,虚拟机上显示的都为'-'(即无法识别),请问是为什么?谢谢!
IT工作者
2022/05/06
2.7K0
基于Logisim的汉字显示实验报告
这个实验部分一共是5个,之前做了第一个,但是没有往这个上面去写,因为那个就是手动的连线,没啥技术含量,所以就没咋写(其实吧,那个实验的目的是啥,我也没看出来,反正就是连线完成了)
阑梦清川
2025/03/25
1660
计算机高频知识点详解
重磅!福建农信社招863人,大专/往届均可报考! 福建农信社报考须知:我是笔试类还是免笔试类? 紧急通知 | 农信社笔试内容大变动 01 计算机中的信息表示 1.ASCII(美国标准信息交换码) 占用空间:1B 数量:128(标准)、256(扩展) 常用字符:A—65、a—97、0--48 2.国标码 《信息交换用汉字编码字符集•基本集》是我国于1980年制定的国家标准GB2312—80,代号为国标码,是国家规定的用于汉字信息交换使用的代码的依据。 3.汉字的机内码 汉字的机内码是供计算机系统内部进行存
企鹅号小编
2018/01/11
6000
密码学之ASCII编码(02)
ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准,并等同于国际标准ISO/IEC 646。ASCII第一次以规范标准的类型发表是在1967年,最后一次更新则是在1986年,到目前为止共定义了128个字符
海拥
2021/08/23
1.1K0
关于字符编码
在计算机中,所有的数据在存储和运算时都是使用二进制数表示。为了互相通信,就必须使用相同的编码规则。ANSI (American National Standard Institute)在1967年发表了一套单字节字符编码方案 - ASCII (American Standard Code for Information Interchange)。后来ISO (International Organization for Standardization) 和IEC (International Electrotechnical Commission)将其定为国际标准 - ISO/IEC 646
Taishan3721
2021/12/02
9100
关于字符编码
GB2312编码_gb2312是简体中文的编码格式
我们制作ASCII字库时,一般只做可以显示出来的字符字模,前面命令型的ASCII字符,我们不做字模,即从“空格开始”,ASCII表对应0x20,所以当我们使用PCtoLcd的16X16选项制作字库时,(注意英文的实际占用的是8X16,要比汉字小半个字宽),所以,如果根据标准ASCII表制作字库时,可以根据字符的汉字相对于“空格”的偏移找到对应字库中的偏移地址,找到对应的字模;如找到”A”对应的字模:Address = (“A” – ” “) X (8 X 16 )/8,从这个偏移地址向后连续取16个字节,即是”A”的所有字模 。
全栈程序员站长
2022/09/20
1.5K0
MySQL处理乱码的步骤
1、首先要明确客户端是何种编码格式,这是最重要的。一般来说,IE使用的是utf8,命令行用GBK,程序用GB 2312
灯珑LoGin
2022/10/31
1.1K0
[建议收藏]缓存雪崩的处理办法
雪花算法是 twitter 开源的分布式 id 生成算法,采用 Scala 语言实现,是把一个 64 位的 long 型的 id,1 个 bit 是不用的,用其中的 41 bit 作为毫秒数,用 10 bit 作为工作机器 id,12 bit 作为序列号。雪花算法SnowFlake生成唯一ID
码农编程进阶笔记
2022/08/18
7980
[建议收藏]缓存雪崩的处理办法
你所不了解的字符编码
前言 在我的工作中,常常会遇到形形色色的字符编码,对于各种编码技术本人了解的也不是很多。 本篇是我了解编码系列的开篇,主要内容讲述字符编码的基本概念,然后介绍一下常见的字符编码,最后说明一下 Java
BUG弄潮儿
2021/06/25
1.1K0
你所不了解的字符编码
字符编码简介
  ASCII(American Standard Code for Information Interchange,美国信息交换标准代码),是一种单字节编码。计算机起源于美国,早期计算机中使用的只有英文,没有其他的语言,而单字节可以表示2**8 -1即255个字符,可以表示所有的英文字符及许多控制符号。而且只用了一半。
py3study
2020/01/19
1.1K0
字符编码简介
相关推荐
刨根究底字符编码之六——简体汉字编码中区位码、国标码、内码、外码、字形码的区别及关系
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档