当前位置:首页 >> 其它课程 >>

字符汉字的编码


3.1 信息的编码 (一)
01010101010101010101010101010101 01010101010101010101010101010101

二进制编码的特征
(1)只有两个基本数码:0,1; (2)采用逢二进一的进位规则; (3)每个数码在不同的数位上,对应不同的权值; (4)一个二进制位称为一个比特(bit)。

例:二进制数(1101.01)2各数位的权值
1 1 0 1 . 0 1

20 21 22 23 2-1

2-2

二进制转换为十进制
按权相加 例:把二进制数(10010)2表示成十进制数是多少? 1 0 0 1 0 =1×24+0×23+0×22+1×21+0×20

20 24 23 21 22

=16+0+0+2+0 =18

十进制转换为二进制(一)
整数部分除2取余 例:(28)10=(1 1 1 0 0)2

2
2 2 2

28 ……0 14 ……0 7 ……1 3 ……1

1

十进制转换为二进制(二)
小数部分乘2取整 例:(0.75)10=( )2

积 整数 0.75×2=1. 5 .......... 1 ? 最高位 0. 5×2=1.0 .......... 1 0.0×2=0.0 .......... 0 ? 最低位 即 (0.75)10=(0.110)2

67

自己做

1、(43.25)10=( 101011.01)2

2、(11010.101)2=(26.625)10

信息的编码
1、在计算机中,各种信息都是用二进制数 字0和1来表示。 2、信息可以分为数值信息与非数值信息。 3、非数值包括字母、文字、控制符、图形 符号。 4、字符代码就是指:字母和符号进行编码 的二进制码

汉字的编码
输 入 编 码 ( 输 入 码 ) 存 储 编 码 ( 机 内 码 ) 输 出 编 码 ( 字 型 码 )

字符的编码
?

ASCII(美国国家信息交换标准)码, 用7位的二进制数表示字符。如:字母 a表示为1100001,实际存储时占8 位。 一个英文字母或符号可以用一个字节 (Byte,简写为B)来表示。 注:1个字节由8个二进制位(bit)构成, 它最多可以表示28=256个字符。

?

?

共有128种不同的字符,其中有94 个图形字符,包括26个大写英文字 母和26个小写英文字母,10个数字 符号,34个专用符号,此外还有34 个控制字符。

ASCII码表(二进制)
高3 位 低4位

000
NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI

001
DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US

010
SP ! " # $ % & ’ ( ) * + , . /

011
0 1 2 3 4 5 6 7 8 9 : ; < = > ?

100
@ A B C D E F G H I J K L M N O

101
P Q R S T U V W X Y Z [ \ ] ^ _

110
` a b c d e f g h i j k l m n o

111
p q r s t u v w x y z { | } ~ DEL

0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111

11

基本ASCII码字符的内容
字符 控制 字符 ASCII编码 0000,0000—0001,1111 和0111,1111 十进制值

0 —9 A—Z a —z 符号

0011,0000— 0011,1001 0100,0001— 0101,1010 0110,0001— 0110,1010 其余

48—57 65—90 97—122

?

?

?

在目前的汉字的处理中,字形信息的表示通常采用点 阵表示法、矢量表示法。 汉字点阵的大小有多种规格,汉字字形质量随点阵数 的增加而优化。点阵越大,描述的字越细致美观,质 量越高。汉字最小点阵16×16一般用于计算机屏幕 显示,24×24点阵常用于普通打印字形,64×64 点阵可以区别仿宋体和黑体字,96×96点阵的汉字 排版系统以及128×128、256×256点阵能充分 表示出字形的笔锋和曲线。点阵数越多,描述一个汉 字字形的字节数也越多,需要计算机存储空间亦越大 . 显示字节数计算方法:点阵数的平方/8

点阵码采用点阵表示汉字字形,即把汉字按字形 排列为点阵,再进行编码。下图为“次”汉字的 点阵和编码。

练习

1、拼音输入法与五笔输入法所生成的汉字机内码一样吗? 2、存储英文“To Be Or Not To Be”需要几个字节? 3、存储“生存还是死亡”6个汉字需要几个字节?

小结
1、计算机只能识别二进制数。 2、常用的字符编码为ASCII码;一个字符占8 bit; 汉字编码为GB码;一个汉字用2个字节(B)表示。


相关文章:
ASCII和汉字编码题目
ASCII和汉字编码题目 - ASCII 和汉字编码题目 1. 要存放 10 个 24× 24 点阵的汉字字模,需要_ ___存储空间。 B、 320B C、 720B D、 72KB )字节 ...
Unicode汉字编码表
Unicode汉字编码表 - Unicode 汉字编码表 1 unicode 编码表 Unicode 目前普遍采用的是 UCS-2,它用两个字节来编码一 个字符, 比如汉字的编码是 0x7EC...
汉字信息的编码知识
汉字信息的编码知识 - 1.汉字信息的编码知识 . 国标码: 年公布的“中华人民共和国国家标准信息交换汉字编码” ⑴国标码:是指我国 1981 年公布的“中华人民共和...
汉字编码关系
我国国家标 准局于 1981 年 5 月颁布了 《信息交换用汉字编码字符集──基本集》 , 代号为 GB2312-80,共对 6763 个汉字和 682 个图形字符进行了编码, 其...
GB2312简体中文编码特殊字符表表
GB2312简体中文编码特殊字符表表_电脑基础知识_IT/计算机_专业资料。GB2312简体中文编码 GB2312 简体中文编码表 code +0 +1 +2 A1A0 、 A1B0 “”【 A1C0...
微型计算机普遍采用的字符编码是( )。 A.原码B.补...
微型计算机普遍采用的字符编码是( )。 A.原码B.补码C.ASCII码D.汉字编码_答案解析_2016年_一模/二模/三模/联考_图文_百度高考
Unicode字符编码分布表——标点符号类
Unicode字符编码分布表——标点符号类_专业资料。汉字编码、字库、中文、汉语Unicode5.1 字符编码分布表——标点符号类标点符号 数学符号 符号 专用符号 通用标点符...
UCS-2 UCS-4 中文字符编码 TTF字库之间的关系
UCS-2 UCS-4 中文字符编码 TTF字库之间的关系_计算机软件及应用_IT/计算机_专业资料。unicode UCS-2 ucs-4 utf-8 utf-16之间有什么关系?ttf又是怎么工作的。...
字符,字节和编码 - Characters, Bytes And Encodi...
字符,字节和编码 - Characters, Bytes And Encoding - 字符,字节和编码 摘要:本文介绍了字符编码的发展过程,相关概念的正确理解。举例说明了一些实际应用中,编码...
几种常见 字符编码详解
位数:UNICODE 字符集有多个编码方式,分别是 UTF-8,UTF-16 和 UTF-32。 2 ,按所表示的文字分类 语言 式名称 英语、西欧语 简体中文 多字节 繁体中 文 字节...
更多相关标签: