gbk编码表gbk内码表怎么看

gbk编码表  时间:2021-01-13  阅读:()

求UTF8中汉字编码范围

u4E00-u9FFF,这个包含了常用的汉字、日文和韩文,扩展部分的范围如下: Extension A (3400–4DBF) Extension B (20000–2A6DF) Extension C (2A700–2B73F) Extension D (2B840–2B81F) 十进制自己用windows自带的科学计算器换算一下吧。

GB2312编码字符是什么意思

文字编码的一种 GB 2312 或 GB 2312-80 是中华人民共和国国家标准简体中文字符集,全称《信息交换用汉字编码字符集·基本集》,又称GB0,由中国国家标准总局发布,1981年5月1日实施。

GB2312编码通行于中国大陆;新加坡等地也采用此编码。

中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。

概述编辑 GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符。

GB 2312的出现,基本满足了汉字的计算机处理需要,它所收录的汉字已经覆盖中国大陆99.75%的使用频率。

但对于人名、古汉语等方面出现的罕用字和繁体字,GB 2312不能处理,因此后来GBK及GB 18030汉字字符集相继出现以解决这些问题。

中文字符集gbk和gb2312有何异同?是一样的吗?

GBK 是又一个汉字编码标准,全称《汉字内码扩展规范》(GBK),英文名称 Chinese Internal Code Specification ,中华人民共和国全国信息技术标准化技术委员会 1995 年 12 月 1 日制订,国家技术监督局标准化司、电子工业部科技与质量监督司 1995 年 12 月 15 日联合以技监标函 [1995] 229 号文件的形式,将它确定为技术规范指导性文件,发布和实施。

这一版的 GBK 规范为 1.0 版。

GB 即“国标”,K 是“扩展”的汉语拼音第一个字母。

GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡过程中的一个承上启下的标准。

ISO 10646 是国际标准化组织 ISO 公布的一个编码标准,即 Universal Multilpe-Octet Coded Character Set(简称 UCS),大陆译为《通用多八位编码字符集》,台湾译为《广用多八位编码字符集》,它与 Unicode 组织的 Unicode 编码完全兼容。

ISO 10646.1 是该标准的第一部分《体系结构与基本多文种平面》。

我国 1993 年以 GB 13000.1 国家标准的形式予以认可(即 GB 13000.1 等同于 ISO 10646.1)。

ISO 10646 是一个包括世界上各种语言的书面形式以及附加符号的编码体系。

其中的汉字部分称为“CJK 统一汉字”(C 指中国,J 指日本,K 指朝鲜)。

而其中的中国部分,包括了源自中国大陆的 GB 2312、GB 12345、《现代汉语通用字表》等法定标准的汉字和符号,以及源自台湾的 CNS 11643 标准中第 1、2 字面(基本等同于 BIG-5 编码)、第 14 字面的汉字和符号。

(一)、字汇 GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充。

具体包括: 1. GB 2312 中的全部汉字、非汉字符号。

2. GB 13000.1 中的其它 CJK 汉字。

以上合计 20902 个 GB 化汉字。

3. 《简化字总表》中未收入 GB 13000.1 的 52 个汉字。

4. 《康熙字典》及《辞海》中未收入 GB 13000.1 的 28 个部首及重要构件。

5. 13 个汉字结构符。

6. BIG-5 中未被 GB 2312 收入、但存在于 GB 13000.1 中的 139 个图形符号。

7. GB 12345 增补的 6 个拼音符号。

8. 汉字“○”。

9. GB 12345 增补的 19 个竖排标点符号(GB 12345 较 GB 2312 增补竖排标点符号 29 个,其中 10 个未被 GB 13000.1 收入,故 GBK 亦不收)。

10. 从 GB 13000.1 的 CJK 兼容区挑选出的 21 个汉字。

11. GB 13000.1 收入的 31 个 IBM OS/2 专用符号。

(二)、码位分配及顺序 GBK 亦采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。

总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个。

全部编码分为三大部分: 1. 汉字区。

包括: a. GB 2312 汉字区。

即 GBK/2: B0A1-F7FE。

收录 GB 2312 汉字 6763 个,按原顺序排列。

b. GB 13000.1 扩充汉字区。

包括: (1) GBK/3: 8140-A0FE。

收录 GB 13000.1 中的 CJK 汉字 6080 个。

(2) GBK/4: AA40-FEA0。

收录 CJK 汉字和增补的汉字 8160 个。

CJK 汉字在前,按 UCS 代码大小排列;增补的汉字(包括部首和构件)在后,按《康熙字典》的页码/字位排列。

2. 图形符号区。

包括: a. GB 2312 非汉字符号区。

即 GBK/1: A1A1-A9FE。

其中除 GB 2312 的符号外,还有 10 个小写罗马数字和 GB 12345 增补的符号。

计符号 717 个。

b. GB 13000.1 扩充非汉字区。

即 GBK/5: A840-A9A0。

BIG-5 非汉字符号、结构符和“○”排列在此区。

计符号 166 个。

3. 用户自定义区(使用者加字区):分为(1)(2)(3)三个小区。

(1) AAA1-AFFE,码位 564 个。

(2) F8A1-FEFE,码位 658 个。

(3) A140-A7A0,码位 672 个。

第(3)区尽管对用户开放,但限制使用,因为不排除未来在此区域增补新字符的可能性。

(三)、字形 GBK 对字形作了如下的规定: 1. 原则上与 GB 13000.1 G列(即源自中国大陆法定标准的汉字)下的字形/笔形保持一致。

2. 在 CJK 汉字认同规则的总框架内,对所有的 GBK 编码汉字实施“无重码正形”(“GB 化”);即在不造成重码的前提下,尽量采用中国新字形。

3. 对于超出 CJK 汉字认同规则的、或认同规则尚未明确规定的汉字,在 GBK 码位上暂安放旧字形。

这样,在许多情况下 GBK 收入了同一汉字的新旧两种字形。

4. 非汉字符号的字形,凡 GB 2312 已经包括的,与 GB 2312 保持一致;超出 GB 2312 的部分,与 GB 13000.1 保持一致。

5. 带声调的拼音字母取半型形式。

GB 2312 码是中华人民共和国国家标准汉字信息交换用编码,全称《信息交换用汉字编码字符集 基本集》,标准号为 GB 2312-80(GB 是“国标”二字的汉语拼音缩写),由中华人民共和国国家标准总局发布,1981年5月1日实施。

习惯上称国标码、GB 码,或区位码。

它是一个简化字汉字的编码,通行于中国大陆地区。

新加坡等地也使用这一编码。

GB 2312-80 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。

其中汉字以外的图形字符 682 个,汉字 6763 个。

GB 2312-80 规定,“对任意一个图形字符都采用两个字节(Byte)表示。

每个字节均采用 GB 1988-80 及 GB 2311-80 中的七位编码表示。

两个字节中前面的字节为第一字节,后面的字节为第二字节。

”习惯上称第一字节为“高字节”,第二字节为“低字节”。

GB 2312-80 将代码表分为 94 个区(Section),对应第一字节;每个区 94 个位(Position),对应第二字节。

两个字节的值,分别为区号值和位号值各加 32(20H)。

GB 2312-80 规定,01~09 区(原规定为 1~9 区,为表示区位码方便起见,今改称 01~09 区)为符号、数字区,16~87 区为汉字区。

而 10~15 区、88~94 区是有待于“进一步标准化”的“空白位置”区域。

但第 10 区推荐与第 3 区的 94 个图形字符(即 GB 1988-80 中的 94 个图形字符)相同,字形宽度为其宽度的一半。

GB 2312-80 把收录的汉字分成两级。

第一级汉字是常用汉字,计 3755 个,置于 16~55 区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字,计 3008 个,置于 56~87 区,按部首/笔画顺序排列。

字音以普通话审音委员会发表的《普通话异读词三次审音总表初稿》(1963年出版)为准,字形以中华人民共和国文化部、中国文字改革委员会公布的《印刷通用汉字字形表》(1964年出版)为准。

gbk编码和汉字间关系

G和B和K都是存储容量的单位,但是GBK就不是,第一次听说多少GBK的概念 一般情况下,一个汉字2B,1K=512汉字,1G=1024M,1M=1024K

GBK码英文字母转换后的数字是什么?

A:A3C1

B:A3C2

C:ASC3

以下是编码表。

A3 0 1 2 3 4 5 6 7 8 9 A B C D E F A   ! " # ¥ % & ' ( ) * + , - . / B 0 1 2 3 4 5 6 7 8 9 : ; < = > ? C @ A B C D E F G H I J K L M N O D P Q R S T U V W X Y Z [ \ ] ^ _ E ` a b c d e f g h i j k l m n o F p q r s t u v w x y z { | }  ̄

gbk内码表怎么看

有一张GBK码表 你可以看一下 想查哪个字用Ctrl+F搜索就可以了 如:“网”的GBK码是CDF8 “络”的GBK码是C2E7 /tech/chinese_internal_code_specification_classified.txt 关于GBK码的定义 百度百科有详细解释 /view/25421.html

轻云互联22元/月,美国硅谷、圣何塞CN2GIA云服务器,香港沙田cn2建站vps仅25元/月

轻云互联怎么样?轻云互联,广州轻云网络科技有限公司旗下品牌,2018年5月成立以来,轻云互联以性价比的价格一直为提供个人,中大小型企业/团队云上解决方案。本次轻云互联送上的是美国圣何塞cn2 vps(免费50G集群防御)及香港沙田cn2 vps(免费10G集群防御)促销活动,促销产品均为cn2直连中国大陆线路、采用kvm虚拟技术架构及静态内存。目前,轻云互联推出美国硅谷、圣何塞CN2GIA云服务器...

妮妮云(30元),美国300G防御 2核4G 107.6元,美国高速建站 2核2G

妮妮云的来历妮妮云是 789 陈总 张总 三方共同投资建立的网站 本着“良心 便宜 稳定”的初衷 为小白用户避免被坑妮妮云的市场定位妮妮云主要代理市场稳定速度的云服务器产品,避免新手购买云服务器的时候众多商家不知道如何选择,妮妮云就帮你选择好了产品,无需承担购买风险,不用担心出现被跑路 被诈骗的情况。妮妮云的售后保证妮妮云退款 通过于合作商的友好协商,云服务器提供2天内全额退款,超过2天不退款 物...

织梦DEDECMS即将授权收费和维权模式 站长应对的几个方法

这两天在站长群里看到不少有使用DEDECMS织梦程序的朋友比较着急,因为前两天有看到来自DEDECMS,我们熟悉的织梦程序官方发布的公告,将会在10月25日开始全面商业用途的使用DEDECMS内容管理程序的会采用授权收费模式,如果我们有在个人或者企业商业用途的,需要联系且得到授权才可以使用,否则后面会通过维权的方式。对于这个事情,我们可能有些站长经历过,比如字体、图片的版权。以及有一些国内的CMS...

gbk编码表为你推荐
qq讨论组如何在手机qq上创建讨论组?淘宝收费淘宝都什么服务是收费的?人人时光机求徐智勇的时光机的歌词,百度上全是周杰轮跟五月天的,我要粤语啊湖南商标注册湖南商标注册怎么办理百度手写百度手写怎么不见了今日热点怎么删除“今日热点”到底要怎样才能取消弹窗,每次开机都会安卓应用平台安卓手机下软件哪个网站好申请证书手机申请证书直播加速手机上什么软件可以帮助直播加速,大神们推荐推荐ios7固件下载iOS7如何升级固件?
ip查域名 3322免费域名 博客主机 服务器日志分析 英文站群 毫秒英文 电子邮件服务器 刀片服务器的优势 qq云端 美国堪萨斯 gtt paypal注册教程 上海服务器 如何注册阿里云邮箱 太原联通测速 空间申请 云服务是什么意思 数据湾 japanese50m咸熟 服务器机柜 更多