当前位置:首页 >> 其它课程 >>

计算机中的字是如何处理的


字符编码
一、西文字符编码:ASCII 码 ASCII 码全称为美国标准信息交换码(American Standard Code for Information Interchange)。它用 8 位二进 制数来编码,第 1 位全部是 0,因此 ASCII 码最多可以表示 2^7=128 个字符,包括字母、数字、标点符号、控制符号 等西文字符。ASCII 码已经被 IS

O 认定为国际标准。 1)控制字符:0~31、127,共 33 个,不可显示; 写字母、33 个标点符号和运算符。 常见 ASCII 码的大小规则,0-9<A-Z<a-z: 2)普通字符:95 个,包括 10 个阿拉伯数字、52 个英文大小

ASCII 码表 L 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 H 0000 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI 0001 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US 0010 SP ! “ # $ % & , ) ( * + ’ . / 0011 0 1 2 3 4 5 6 7 8 9 : ; < = > ? 0100 @ A B C D E F G H I J K L M N O 0101 P Q R S T U V W X Y Z [ \ ] ^ _ 0110 ‘ a b c d e f g h i j k l m n o 0111 p q r s t u v w x y z { | } ~ DEL

记住几个常见字母的 ASCII 码大小:“A”为 65;“a”为 97;“0”为 48; 在计算机系统中,用 1 字节来存储一个 ASCII 字符。上表是标准 ASCII 字符,有一个特点:最高位(第八位)为 0。还 有一种叫做扩充 ASCII 码,它是用 8 位二进制数给字符编码,这样可以表示 256 种字符。 二、汉字编码 计算机处理汉字时,也必须先将汉字代码化,然后对汉字代码进行处理。 1.汉字国标码 中国的文字不是拼音文字,汉字的个数有数万之多,远远超过区区 256 个字符,因此我们就使用两个字节来表示 一个中文。为了与 ASCII 保持兼容,与 ASCII 码相同的编码我们不使用。 1980 年我国颁布了《信息交换用汉字编码字符集(基本集)》GB2312-80,简称国标码(或 GB 码),一共收集了 7445 一级汉字 3755 个, 按汉字拼音字母顺序排列; 二级汉字 3008 个, 按部首 笔画汉字排列。 。 个字符, 其中汉字 6763 个。 两个字节编码一个国标码字符。

2.汉字的机内表示:机内码: 计算机在信息处理时表示汉字的编码,称作机内码。现在我国都用国标码(GB2312)作为机内码。 中国的台湾省也在使用中文,但是由于历史的原因,那里没有使用大陆的简体中文,还在使用着繁体的中文,并且 他们自己也制定了一套表示繁体中文的字符编码, 称为 BIG5,不幸的是, 虽然他们的也使用两个字节来表示一个汉字, 但他们没有象我们兼容 ASCII 一样兼容大陆的简体中文,他们使用了大致相同的编码范围来表示繁体的汉字。天哪! ISO8859 的悲剧又出现在同样使用汉字的中国人身上了,同样的编码在大陆和台湾的编码中实际上表示不同的字符, 大陆的玩家在玩台湾的游戏时,经常会遇到乱码的问题, 问题根源就在于,大陆的计算机默认字符的编码就是 GB2312, 当碰到台湾使用 BIG5 编码的文字时,就会作出错误的转换。 3.汉字输入码――输入码(外码) 汉字输入码是指直接从键盘输入的各种汉字输入方法的编码。编码方法主要有三种:数字编码、拼音编码和字型 编码。 数字编码:是用一串数字代表一个汉字。拼音编码:是以汉字读音为基础的输入法。字型编码:是根据汉字形 状确定的编码。 (1) 数字码(或流水码)如:电报码、区位码、纵横码 优点:无重码,不仅能对汉字编码,还能对各种字母、数字符号进行编码。 缺点:是人为规定的编码,属于无理码,只能作为专业人员使用。 (2) 字音码如:全拼、双拼、微软拼音 优点:简单易学。 缺点:汉字同音多,所以重码很多,输入汉字时要选字。 (3) 字形码如:五笔字型、表形码、大众码、四角码 优点:不考虑字的读音,见字识码,一般重码率较低,经强化训练后可实现盲打。 缺点:拆字法没有统一的国家标准,拆字难,编码规则繁,记忆量大。 (4) 音形码如:声形、自然码、钱码 优点:利用音码的易学性和形码可有效减少重码的优点。 缺点:既要考虑字音,又要考虑字形,比较麻烦。 4.汉字的输出:字形码 在屏幕上显示或在打印机上打印出来的点阵存储信息,由汉字的字模信息所组成。 (1)点阵字形: 16X16、24X24、32X32、48X48、64X64 每一个点在存储器中用一个二进制位(bit)存储,所以一个 汉字需要 32(16×16/8=32)个字节存储空间。 字形 字笔画的轮廓用一组直线和曲线勾画。记录的是这些几何形状 系。精度高。Windows 的 TrueType 字库采用此法。 5. 计算机汉字的处理过程: 键盘输入(输入码)——编码转换(机内码)——编辑与输出 (字型码) 之间的关 16×16 点阵 (2)轮廓


相关文章:
计算机中的字是如何处理的
计算机中的字是如何处理的_电脑基础知识_IT/计算机_专业资料。字符编码一、西文字符编码:ASCII 码 ASCII 码全称为美国标准信息交换码(American Standard Code for ...
汉字信息在计算机中的处理 汉字 计算机 汉字信息
一、汉字信息在计算机中的处理与存储计算机对每一个字符进行编码形成其对应的唯一一个内码就是汉字的存储, 然而同一个字符(例如“中”字)不同编码对应的内码不一...
汉字信息在计算机中的处理
随着计算机技术的发展,计算机具有了中文信息处理的能力,在上次课中,我 们已经学习了第一节的文字及其处理技术, 那么我想问你, 汉字信息在计算机中是如何进行 处理...
汉字计算机中的表示
汉字计算机中的一、前言众所周知,英文是拼音文字,一个不超过 128 种字符的字符...用计算机处理汉字,首先要解决汉字在计算机里如何表示的问题,即汉字编码问题。根 ...
文字及其处理
文字处理技术的发展变化及其历史意义,要通 过汉字发展历程的讲述, 使学生领悟传承发展民族文化的必要性和紧迫性;第二 部分主要任务是了解文字计算机中的编码方式,...
1.3 文字符号在计算机中的表示与处理
1.3 文字符号在计算机中的表示与处理 1.3.1 西文字符的编码 西文是由拉丁字母、 数字、 标点符号及一些特殊符号所组成的, 它们统称为字符。 所有字符的集合称...
计算机中的数据表示方法
计算机中的数据表示方法计算机中的数据表示方法 数据是指能够输入计算机并被计算机...一个字通常由 一个或若干个字节组成,由于字长是计算机一次所能处理信息的实际...
2014计算机作业1答案
字节(Byte):是计算机信息技术用于计量存储容量和传输容量的一种计量 单位,1 个字节等于 8 位二进制。 字:在计算机中,一串数码作为一个整体来处理或运算的,称 ...
教案:计算机中的文字表示
教案:计算机中的文字表示_计算机软件及应用_IT/计算机_专业资料。高中信息技术课...big endian 和 little endian 是 CPU 处理多字节数的不同方式。例如"汉"字的...
《文字及其处理技术》
体验文字处理技术的发展变化及其历史意义 了解文字计算机中的编码方式 了解文字处理技术的发展变化及其意义,领悟传承发展民族文化的必要性和紧迫性 了解文字在计算机中...
更多相关标签:
计算机如何处理汉字 | 计算机如何处理文字 | 计算机文字录入处理员 | 计算机汉字的处理过程 | 计算机文字处理软件 | 计算机文字处理试题 | 计算机文字处理 | 计算机一级考试字处理 |