汉字代码什么是汉字编码

汉字代码  时间:2021-09-22  阅读:()

每个汉字的内部码?请帮忙解释一下?

答:汉字是一种象形文字,每个汉字可以看成一个特定图形,例如用16*16点阵表示一个汉字,则一个汉字占16行,每行有16个点,其中每个点用一个二进制数字表示,值0表示暗,值1表示亮。

由于计算机存储器每个字节有八个二进制位,因此16个点要用两个字节来存放,一个汉字用三十二个字节表示。

16点*16点=(8点+8点)*16行 即(1字节+1字节)*16行=32字节。

(注:八个点相当一字节) 100个字为3200字节

在计算机内字符,汉字是如何编码的?

在电脑内,汉字的编码分为四种:输入码、 国标码、内码和字型码。

输入码:包括拼音编码和字型编码。

微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。

国标码:又称为汉字交换码,在计算机之间交换信息用。

用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。

将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。

例如“中”字的国标码为8680(十进制)或7468(十六进制)。

内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。

无论使用何种输入码,进入计算机后就立即被转换为机内码。

规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。

例如,“中”字的内码以十六进制表示时应为F4E8。

这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。

字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。

通常用点阵、矢量函数等表示。

用点阵表示时,字形码指的就是这个汉字字形点阵的代码。

根据输出汉字的要求不同,点阵的多少也不同。

简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。

如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。

那么,24行共占用3′24=72个字节。

计算公式:每行点数/8′行数。

依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。

汉字在计算机中是如何编码的

汉字编码中现在主要用到的有三类,包括GBK,GB2312和Big5。

1、GB2312又称国标码,由国家标准总局发布,1981年5月1日实施,通行于大陆。

新加坡等地也使用此编码。

它是一个简化字的编码规范,当然也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。

我们平时说6768个汉字,实际上里边有5个编码为空白,所以总共有6763个汉字。

GB2312规定“对任意一个图形字符都采用两个字节表示,每个字节均采用七位编码表示”,习惯上称第一个字节为“高字节”,第二个字节为“低字节”。

GB2312中汉字的编码范围为,第一字节0xB0-0xF7(对应十进制为176-247),第二个字节0xA0-0xFE(对应十进制为160-254)。

GB2312将代码表分为94个区,对应第一字节(0xa1-0xfe);每个区94个位(0xa1-0xfe),对应第二字节,两个字节的值分别为区号值和位号值加32(2OH),因此也称为区位码。

01-09区为符号、数字区,16-87区为汉字区(0xb0-0xf7),10-15区、88-94区是有待进一步标准化的空白区。

2、Big5又称大五码,主要为香港与台湾使用,即是一个繁体字编码。

每个汉字由两个字节构成,第一个字节的范围从0X81-0XFE(即129-255),共126种。

第二个字节的范围不连续,分别为0X40-0X7E(即64-126),0XA1-0XFE(即161-254),共157种。

3、GBK是GB2312的扩展,是向上兼容的,因此GB2312中的汉字的编码与GBK中汉字的相同。

另外,GBK中还包含繁体字的编码,它与Big5编码之间的关系我还没有弄明白,好像是不一致的。

GBK中每个汉字仍然包含两个字节,第一个字节的范围是0x81-0xFE(即129-254),第二个字节的范围是0x40-0xFE(即64-254)。

GBK中有码位23940个,包含汉字21003个。

汉字编码一般分为哪几类

big5(繁体中文,台湾) gb2312(简体中文,提供大约6763常用字) gbk(gb2312的扩展,编码范围8140-FEFE,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个) gb18030(GB18030汉字库包含了27484个汉字。

因此GB18030汉字库包含的汉字更多,但在系统支持上有限) 其中gb2312最通用

汉字编码有哪些类型,各有什么特点

汉字编码有五种类型,分别是整字输入法、字形分解法、字形为主字音为辅的编码法、拼音为主字形为辅的编码法、全拼音输入法。

具体特点如下: 1、整字输入法 将三四千个常用汉字排列在一个具有三四百个键位的大键盘上;一字一格(键),无重码,直观性好,操作简单;但需特制键盘,速度较慢。

2、字形分解法 汉字的形体分解成笔画或部件,按一定顺序输进机器;按形取码,不涉及字音,因而不认识的字也同样可以编码输入;汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一。

3、字形为主、字音为辅的编码法 要利用某些字音信息,如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码;有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。

4、全拼音输入法 以现行的汉语拼音方案为基础进行设计;操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理。

5、拼音为主、字形为辅的编码法 在拼音码前面或后面再添加一些字形码,拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”;除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。

扩展资料: 定型标准 1、定型化 编码方案的定型化,即一般所说的选优工作,对计算机的普及应用非常重要。

当然,定型或选优并不意味着只定一种或只选一种,而要照顾到多种用户的需要。

2、标准化 1981年,国家标准局公布了《信息交换用汉字编码字符集基本集》(简称汉字标准交换码),共分两级,一级3755个字,二级3008个字,共6763个字。

这种汉字标准交换码可以为各种输入输出设备的设计提供统一的标准,使各种系统之间的信息交换有共同一致性。

参考资料来源:百度百科-汉字编码

什么是汉字编码

计算机内部使用的汉字编码称为汉字内码或汉字机内码。

汉字机内码由国标码(GB2312-80)演化而来,把表示国际码的两个字节的最高位分别加1,就变成了汉字机内码。

汉字字模信息码即汉字字形码,用点阵方式来构造汉字字型。

它们的关系是这样的,汉字输入编码是外部码,同一个汉字可以有不同的输入编码,但它们的汉字机内码是惟一的。

汉字的输出则根据点阵方式构成的汉字字模信息码输出。

汉字编码系统 为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。

国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。

GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。

BIG5码。

收录13053个汉字。

在台湾和香港使用的一字节或两字节编码。

Unicode并不被中国政府很好的接受。

中国政府要求在中国大陆出售的软件必须支持GB 18030编码。

在国际通信化和软件设计领域,CJK编码收集了汉语、日语、韩语中的汉字集。

  • 汉字代码什么是汉字编码相关文档

knownhost西雅图/亚特兰大/阿姆斯特丹$5/月,2个IP1G内存/1核/20gSSD/1T流量

美国知名管理型主机公司,2006年运作至今,虚拟主机、VPS、云服务器、独立服务器等业务全部采用“managed”,也就是人工参与度高,很多事情都可以人工帮你处理,不过一直以来价格也贵。也不知道knownhost什么时候开始运作无管理型业务的,估计是为了扩展市场吧,反正是出来较长时间了。闲来无事,那就给大家介绍下“unmanaged VPS”,也就是无管理型VPS,低至5美元/月,基于KVM虚拟,...

CUBECLOUD:香港服务器、洛杉矶服务器、全场88折,69元/月

CUBECLOUD(魔方云)成立于2016年,亚太互联网络信息中心(APNIC)会员,全线产品均为完全自营,专业数据灾备冗余,全部产品均为SSD阵列,精品网络CN2(GIA) CU(10099VIP)接入,与当今主流云计算解决方案保持同步,为企业以及开发者用户实现灵活弹性自动化的基础设施。【夏日特促】全场产品88折优惠码:Summer_2021时间:2021年8月1日 — 2021年8月8日香港C...

BuyVM商家4个机房的官方测试IP地址和测速文件

BuyVM 商家算是有一些年头,从早年提供低价便宜VPS主机深受广大网友抢购且也遭到吐槽的是因为审核账户太过于严格。毕竟我们国内的个人注册账户喜欢账户资料乱写,毕竟我们看英文信息有些还是比较难以识别的,于是就注册信息的时候随便打一些字符,这些是不能通过的。前几天,我们可以看到BUYVM商家有新增加迈阿密机房,而且商家有提供大硬盘且不限制流量的VPS主机,深受有一些网友的喜欢。目前,BUYVM商家有...

汉字代码为你推荐
硬盘数据线多少钱硬盘连接主板的线叫什么线啊,我想买一条,大概价格是多少啊张北论坛现任张北县副县长有几位北京移动官网北京移动网上营业厅神州行套餐修改声源定位产生视觉、听觉产生的部位是(  ) A.视网膜;耳蜗 B.大脑皮层;大脑皮层 C.晶状体;听小骨声源定位大脑皮层中央后回和中央前回分别对应什么中枢?洛奇英雄传s2洛奇英雄传传奇套装在第二季还会贵么高清网络球机高清网络半球摄像机、快球摄像机、枪机的区别在哪网络培训系统远程培训具体是什么意思?会议管理平台会议推广用什么软件好郑州网站托管郑州市那家做网站托管以及域名申请的联系我下谢谢。
郑州服务器租用 如何申请免费域名 免费动态域名 wordpress主机 云网数据 westhost 便宜域名 发包服务器 河南服务器 三拼域名 卡巴斯基官方免费版 宁波服务器 流量计费 免费的asp空间 上海电信测速 免费ftp 工信部icp备案查询 国外网页代理 godaddy空间 建站论坛 更多