汉字代码查询求帮忙查汉字编码

汉字代码查询  时间:2021-06-30  阅读:()

汉字及其编码

所谓编码,是以固定的顺序排列字符,并以此做为记录、存贮、传递、交换的统一 内部特征,这个字符排列顺序被称为“编码”。

字库的编码是字库组织的依据,也是文字处理的基础。

不同国家和地区有不同的编 码标准,和中文字库有关的常见编码有:单字节编码、GB2312-80、GB12345-90、GBK、U nicode编码、ISO10646 / Unicode字符集、GB18030-2000、BIG5编码,下面简要介绍一 下: 单字节编码 MS Windows:Windows Latin 1(ANSI) MS-DOS:MS-DOS Latin US Macintosh:Macintosh Roman GB2312-80 全称是GB2312-80《信息交换用汉字编码字符集 基本集》,1980年发布,是中文信 息处理的国家标准,在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯 一中文编码。

P-Windows3.2和苹果OS就是以GB2312为基本汉字编码, Windows 95/98则 以GBK为基本汉字编码、但兼容支持GB2312。

双字节编码 范围:A1A1~FEFE A1-A9:符号区,包含682个符号 B0-F7:汉字区,包含6763个汉字 GB码共收录6763个简体汉字、682个符号,其中汉字部分:一级字3755,以拼音排 序,二级字3008,以偏旁排序。

该标准的制定和应用为规范、推动中文信息化进程起了 很大作用。

GB12345-90 1990年制定了繁体字的编码标准GB12345-90《信息交换用汉字编码字符集 第一辅助 集》,目的在于规范必须使用繁体字的各种场合,以及古籍整理等。

该标准共收录6866 个汉字(比GB2312多103个字,其它厂商的字库大多不包括这些字),纯繁体的字大概有 2200余个。

双字节编码 范围:A1A1~FEFE A1-A9:符号区,增加竖排符号 B0-F9:汉字区,包含6866个汉字 Unicode编码(Universal Multiple Octet Coded Character Set) 国际标准组织于1984年4月成立ISO/IEC JTC1/SC2/WG2工作组,针对各国文字、符号 进行统一性编码。

1991年美国跨国公司成立Unicode Consortium,并于1991年10月与WG2 达成协议,采用同一编码字集。

目前Unicode是采用16位编码体系,其字符集内容与ISO1 0646的BMP(Basic Multilingual Plane)相同。

Unicode于1992年6月通过DIS(Draf International Standard),目前版本V2.0于1996公布,内容包含符号6811个,汉字209 02个,韩文拼音11172个,造字区6400个,保留20249个,共计65534个。

ISO10646 / Unicode字符集 全球可以共享的编码字符集。

UCS-4:组八位 平面八位 行八位 字位八位 UCS-2:00组中的00平面是基本多文种平面(BMP),4E00~9FFF 中日韩文字 Ext A(CJK):3400~4DB7,共6584字 Ext B(CJK):42,807个汉字,在第2平面的0100~A836 GBK编码(Chinese Internal Code Specification) GBK编码是中国大陆制订的、等同于UCS的新的中文编码扩展国家标准。

GBK工作小组 于1995年10月,同年12月完成GBK规范。

该编码标准兼容GB2312,共收录汉字21003个、 符号883个,并提供1894个造字码位,简、繁体字融于一库。

Windows95/98简体中文版的字库表层编码就采用的是GBK,通过GBK与UCS之间一一对应的 码表与底层字库联系。

英文名:Chinese Internal Code Specification 中文名:汉字内码扩展规范1.0版 双字节编码,GB2312-80的扩充,在码位上和GB2312-80兼容 范围:8140~FEFE(剔除xx7F)共23940个码位 包含21003个汉字,包含了ISO/IEC 10646-1中的全部中日韩汉字 记得采纳啊

求帮忙查汉字编码

五种类型的编码法
据粗略统计,现有400多种编码方案,其中上机通过试验的和已被采用作为输入方式的也有数十种之多。

归纳起来,不外5种类型:
  ①整字输入法:前一阶段,一般是将三四千个常用汉字排列在一个具有三四百个键位的大键盘上。

近来,大多是将这些汉字按XY坐标排列在一张字表上,通常叫“字表法”,或“笔触字表法”。

比如,X25行和Y90列交叉的字为“国”,当电笔点到字表上的“国”字时,机器自动将该字的代码2590输入。

键盘上或字表中字按部首或按音序或按字义联想而排列。

不常用的字作为盘外字或表外字,另行编码处理。


  ②字形分解法:将汉字的形体分解成笔画或部件,按一定顺序输进机器。

笔画一般分成 8种:横(一)、竖(丨)、撇(丿)、点(丶)、折(□)、弯(□)、叉(十)、方(口)。

部件一般归纳出一二百个。

由于一般键盘上只有42个键(包括数字和标点),容纳不下这么多部件,因而有人设计中键盘,也有人利用部件形体上的相似点或出现概率的不同,而把100多个部件分布在26个字母键上。


  ③字形为主、字音为辅的编码法:这种编码法与字形分解法的不同在于还要利用某些字音信息。

如有的方案为了简化编码规则,缩短码长,在字形码上附加字音码,有的方案为了采用标准英文电传机,将分解归纳出来的字素通过关系字的读音转化为拉丁字母。


 ④全拼音输入法:绝大多数是以现行的汉语拼音方案为基础进行设计。

关键问题是区分同音字,因而有的方案提出“以词定字”的方法,还有的方案提出“拼音-汉字转换法”,即“汉语拼音输入 ──机内软件变换(实为查机器词表)──汉字输出”系统。


  ⑤拼音为主、字形为辅的编码法:一般在拼音码前面或后面再添加一些字形码。

拼音码有用现行汉语拼音方案或稍加简化的,还有的为了缩短码长而把声母和韵母都用单字母或单字键表示的“双拼方案”或“双打方案”。

如F键既表声母F,又表韵母ang,连击两下,便是Fang“方”字。

区分同音字的字形码也多种多样。

除了大部分采用偏旁部首的信息外,还有采用起末笔或采用语义类别的。


  上述各种编码法,各有短长。

例如,字表法的特点是一字一格(键),无重码,直观性好,操作简单。

缺点是需特制键盘,速度较慢。

字形分解法的好处是按形取码,不涉及字音,因而不认识的字(包括生僻字、古字)也同样可以编码输入;但汉字形体结构非常复杂,写法也有许多差异,分解标准不易统一,因而不少方案规则较多。

拼音输入法(包括拼音-汉字转换法)的优点是操作简捷,可以“盲打”,不受汉字简化、字形改变的影响,符合拼音化方向,并且还便于作进一步信息处理;缺点是不认识的字无法输入;另外,如果不加字形码或不用以词定字法或显式选择法,同音字较难处理。


DiyVM(50元起)老牌商家,香港沙田CN2直连vps/不限流量/五折终身优惠

diyvm怎么样?diyvm是一家国内成立时间比较久的主机商家了,大约在6年前站长曾经用过他家的美国机房的套餐,非常稳定,适合做站,目前商家正在针对香港沙田机房的VPS进行促销,给的是五折优惠,续费同价,香港沙田机房走的是CN2直连的线路,到大陆地区的速度非常好,DiyVM商家采用小带宽不限流量的形式,带宽2Mbps起步,做站完全够用,有需要的朋友可以入手。diyvm优惠码:五折优惠码:OFF50...

萤光云(13.25元)香港CN2 新购首月6.5折

萤光云怎么样?萤光云是一家国人云厂商,总部位于福建福州。其成立于2002年,主打高防云服务器产品,主要提供福州、北京、上海BGP和香港CN2节点。萤光云的高防云服务器自带50G防御,适合高防建站、游戏高防等业务。目前萤光云推出北京云服务器优惠活动,机房为北京BGP机房,购买北京云服务器可享受6.5折优惠+51元代金券(折扣和代金券可叠加使用)。活动期间还支持申请免费试用,需提交工单开通免费试用体验...

Linode 18周年庆典活动 不断改进产品结构和体验

今天早上相比很多网友和一样收到来自Linode的庆祝18周年的邮件信息。和往年一样,他们会回顾在过去一年中的成绩,以及在未来准备改进的地方。虽然目前Linode商家没有提供以前JP1优化线路的机房,但是人家一直跟随自己的脚步在走,确实在云服务器市场上有自己的立足之地。我们看看过去一年中Linode的成就:第一、承诺投入 100,000 美元来帮助具有社会意识的非营利组织,促进有价值的革新。第二、发...

汉字代码查询为你推荐
旺旺群发手机旺旺怎么群发信息?网络视频下载器那些视频下载器比较全而且好用?暴力破解rar怎么暴力破解rar密码?快速且有效的pat是什么格式怎么能把常用格式的图片转换成PAT格式的呀~broadcast播播……拼音shoujiao手机电池突然充不上电,是怎么回事?该怎么办?云输入法如何使用QQ云输入法?sms是什么短信验证是什么?za是哪个国家的ci是在哪个国家产生的?哪个国家开始流行的动画分镜头脚本动漫脚本和分镜头的区别?懂的进
外国虚拟主机 台湾虚拟主机 三级域名网站 希网动态域名 阿云浏览器 winscp vpsio googleapps 轻博客 patcha 最好的空间 e蜗 老左正传 赞助 phpmyadmin配置 100m独享 空间技术网 如何注册阿里云邮箱 中国电信宽带测速器 丽萨 更多