当前位置:首页 >> 计算机软件及应用 >>

模式识别课论文


模式识别在手写数字识别中研究
摘要:手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也 是模式识别领域中最成功的应用之一。由于识别类型较少,在实际生活中有深远 的应用需求, 一直得到广泛的重视, 通过对数据采集的预处理, 特征提取与选择, 建立相应的知识库,应用模式识别的方法来进行研究。 关键字:模式识别 手写数字识别 特征提取 预处理 Abstract: Handwritten numeral recognition of character recognition is a research topic, is the hot research topic for many years, but also is one of the most successful application in the field of pattern recognition. Due to the identification type less,it has a profound application requirement in real life, has been widely attention, and through the data acquisition preprocessing, feature extraction and selection, the establishment of the corresponding knowledge base, the application of pattern recognition method for research Keyword: pattern recognition hand-written numeral recognition feat ure extraction preprocessing 1. 引言 手写数字识别(H andw ritten N um eral R ecognition)是光学字符识别 技术(O ptical C haracter R ecognition, 简称O C R )的一个分支, 它研究的 对象是, 如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字。在整个O C R 领域中, 最为困难的就是脱机手写字符的识别, 到目前为止, 尽管人们在 脱机手写英文、汉字识别的研究中已取得很多可喜成就, 但距实用还有一定距 离。 而在手写数字识别这个方向上, 经过多年研究, 研究工作者已经开始把它向 各种实际应用推广。 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国 家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体 和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息, 主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据, 如: 邮政编码、 统计报表、 财务报表、 银行票据等等, 处理这类信息的核心技术是手写数字识别。 因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将 产生巨大的社会和经济效益。 在整个 OCR 领域中, 最为困难的就是脱机自由手写字符的识别。 到目前为止, 尽管人们在脱机手写英文、 汉字识别的研究中已取得很多可喜成就,但距离实用 还有一定距离。而在手写数字识别这个方向上,经过多年研究,研究工作者已经 开始把它向各种实际应用推广,为手写数据的高速自动输入提供了一种解决方 案。 本文首先介绍了自由手写体数字识别的基本原理,包括数字图像预处理、特

征提取和模式识别的基本原理和方法;其次介绍了;最后通过基于 MATLAB 的实 验结果,对本系统的性能进行了分析。 2. 手写数字识别的原理 手写数字的写法带有明显的地区性和民族性, 因而选择一个可供系统训练 和测试使用的样本库是手写数字识别研究的重要基础之一, 对识别系统的性能 也有重要的影响。 研究者对所需的样本库有两种选择: 一是自己根据需要建立专 门的样本库, 二是选用其它机构做好的现成的样本库。 本系统主要由手写体数字 识别的训练过程和识别过程组成,训练过程和识别过程均包括预处理、特征提取 和模式识别三部分,流程图如图2.1

待识对象

数据采集, 预处理

特征提取 与选择

分类识别

识别过程 训练过程
训练样本 数据采集, 预处理 特征提取 与选择 分类识别

人工干预

改进数据采集, 预处理

改进特征提取 与选择 改进分类识别

正确率 测试

图 2.1 总之, 从手写体数字识别原理可见,手写体数字识别技术主要包括以下几点: (1) 数据采集预处理,包括彩色图像转成灰度图像、二值化,归一化,滤除干 扰噪声等,如下图;

图 2.2 原始图像

图 2.3 预处理后图像

(2).特征提取与选择,特征提取是字符识别中的一个重要组成部分,是模式识 别的核心之一。经过预处理后,根据识别方法的要求抽取图像特征,作为识别的

依据。一般而言,选择的特征一方面要求能够足够代表这个图像模式,另一方面 要求它们的数量尽可能少, 这样能有效地进行分类和较小的计算量。特征提取的 好坏会直接影响其识别的分类效果,进而影响识别率,因此特征选择是模式识别 的关键。但是,目前还没有一个有效的、一般的抽取、选择特征的方法。抽取、 选择特征的方法都是面对问题的, 因此针对不同的识别问题往往有不止一种的抽 取、选择特征的方法。 本文特征提取的首要任务是要确定细化后图像的那些特征点作为图像的特 征,这里只提取图像的结构特征作为网络输入值。其中结构特征有九个,包括竖 直中线交点数、竖直 1/3 处交点数、竖直 2/3 处交点数、水平 1/5 处交点数、水平 4/5 处交点数、右拐点数、左拐点数、上端点数、下端点数。结构特征的选择与 提取算法如下述。 对经过预处理的图像进行分割,分别在图像的水平区域 1/3、1/2、2/3 处设置 3 条竖线,在图像的竖直区域 1/3、2/3 处设置 2 条水平线,分别计算直线与图像 数字笔段的交点数,求得前五个特征值。如下左图 2.4 所示:

图 2.4 再分别提取图像的左拐点数与右拐点数,如上右图 2.4 所示。 以 1/3 竖交点数为例,提取交点数特征的算法如下: 1) 按从上到下,从左到右的顺序扫描预处理后图像并选择第一个像素点 P; 2) 如果 P 点为黑像素点则选择下一个像素点,若该像素点为白色则对交点 数加 1,若还是黑像素点则继续选择下一个像素点,如此循环直到该行 (列)像素点被遍历完。 其他交点数的提取与上述算法类似。 以提取左拐点数为例,提取拐点数特征的算法如下: 1) 按从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点 P; 2) 查看它右下点是否为黑像素点,如果不是则转 1),否则查看右下点其正 下的点,直到新点不是黑像素点,再查看此新点的正左点是否为黑像素 点,如果是黑像素点,则这就是一个左拐点。当然由于细化工作的不太 确定性,也有可能是此新点的左上角点是黑像素点,那么这也可以看成 一个非严格意义上的左拐点。 再以图像的上 1/3 处的水平分割线为界,计算图像的上端点数,以图像的下

1/3 处的水平分割线为界,计算图像的下端点数。提取端点数特征的算法如下: 1) 从上到下,从左到右的顺序扫描预处理后图像并选择黑像素点 P; 2) 计算像素 P 的 8 邻域之和 N; 3) 若 N=1,则像素 P 为端点,如果端点位于图像的上 1/3 内,则上端点计数 器加一;如果端点位于图像的下 1/3 内,则下端点计数器加一; 4) 重复步骤 1-3,直到遍历整个图像。 通过以上方法对数字图像的结构特征进行提取,得到 9 个数字特征,这 9 个 特征组成一个特征向量, 这个特征向量将作为神经网络的输入值。该向量的排列 如下: DATA= [ 竖直中线交点数,竖直 1/3 处交点数,竖直 2/3 处交点数,水平 1/5 处交点数,水平 4/5 处交点数,左拐点数,右拐点数,上端点数,下端点数] 3.知识库的建立 由于本文采用的是基于模式知识库的识别方法, 所以对字符的结构特征的分 析以及字符模型的构造是一个十分重要的环节,图 2.5 就是对识别数字的标准形 态进行具体分析而构造的模板。

图 2.5 DATA01=[2,2,2,2,2,2,2,2,0]; DATA11=[1,0,0,1,1,1,1,1,2]; DATA21=[3,3,3,1,1,1,1,1,3]; DATA31=[3,2,3,1,1,1,2,2,3]; DATA41=[1,1,1,2,2,1,3,2,4]; DATA51=[3,3,3,1,1,1,2,2,4]; DATA61=[3,3,2,1,1,2,3,2,1]; DATA71=[2,2,2,1,1,1,1,1,2]; DATA81=[4,4,4,2,2,2,2,2,0]; DATA91=[3,3,3,1,2,1,3,1,1]。 由于本系统是对自由手写体进行识别, 因而要考虑数字书写体的多变性。通 过对图 2.6 所示数字变体的分析来对知识库进行补充。

图 2.6 DATA02=[1,1,2,2,2,2,1,2,2]; DATA22=[3,2,2,1,1,1,1,3,2]; DATA32=[3,1,4,2,1,1,2,2,3];

DATA42=[1,2,2,3,3,1,2,2,2]; DATA52=[3,3,3,1,1,1,2,2,4]; DATA62=[3,1,3,1,1,2,2,2,2]; DATA82=[4,4,4,2,1,2,1,2,2]; DATA92=[3,2,3,2,1,1,3,1,3]。 最后得到知识库由上述两套模板所组成。 4.模式识别的方法 在本次设计过程中, 我们选择了模板匹配的识别方法。通过计算欧氏距离来 衡量匹配程度。本系统中的特征矢量有 9 个分量,其计算距离公式如下:
2 ? 9 ? d ? ?? xi ? yi ? ? i ?1 ? ? ? 1 2

公式 (2.1) 但在本次设计中我们计算距离时对上述

公式进行了改进, 对于可靠性较高的端点数即最后一维特征值加大了权重,改进 后的距离计算公式如下:
? 8 2 2? d ? ? ? xi ? yi ? 3 ? x9 ? y9 ? ? i ?1 ?
1 2

公式(2.2)

在识别过程, 分别计算待识别图像的特征值与知识库中两个模板的距离,与 10 个数字逐个比较,距离最小的对应的数字就是最后识别结果。该算法具有特 征提取和模板建立都比较直观,时间复杂度低,易于实现等优点。其缺点是在建 立知识库时需要进行大量的训练,当知识库中的模板增多时,特征矢量间的距离 会减小。 5.结论 本文对自由手写体数字识别的基本原理及方法作了介绍,分析表明,基于所 用结构模型和知识库的识别方法对规范手写体数字是可行的, 具有较高的识别率 及较好的抗噪性能, 也可以识别一定条件下的自由手写体数字。为了提高识别率 和可靠性,除了要增强对噪声的滤除能力外,还要增大知识库,以解决细化中出 现的结构畸变问题,这些都有待我们进一步的研究。 6.参考文献 [1]边肇祺 张学工等编著 《模式识别》第二版 [2] 计算机时代 2007 年第 3 期 [3] 章毓晋.图象处理和分析.北京:清华大学出版社[M], 2003. [4] 武汉科技大学学报 吴谨 《自由手写体数字识别系统的设计与实现》


赞助商链接
相关文章:
模式识别课程论文
模式识别课程论文 - 模式识别中的贝叶斯决策 学专班 院业级 信息电子技术 电子信息工程 级1班 学籍号姓名 指导教师 信息电子技术学院 2016 年 10 月 25...
模式识别课程论文
模式识别课程论文_管理学_高等教育_教育专区。模式识别算法 专业班级: 姓学名: 号: 计软 1401 兰俊锋 20141214023 首先对模式识别所用到的理论、研究背景、研究...
模式识别结课论文
模式识别课论文 题学专姓学 目:模式识别中基于支持向量机算法分析 院: 业: 名: 号: 电气工程与信息工程学院 电气工程 指导教师: 教授 1 支持向量机支持...
模式识别论文
模式识别论文 - 模式识别综述与应用 院系:计算机与通信工程学院 班级:电子信息 10-01 班 姓名: 学号: 模式识别综述与应用 摘要 模式识别就是研究用计算机实现...
模式识别人工智能论文
模式识别人工智能论文_电脑基础知识_IT/计算机_专业资料。浅谈人工智能与模式识别...四、心得体会很荣幸能在本学期学习模式识别这门课程, 这是一门很实用并且有着...
模式识别小论文
模式识别小论文 - 模式识别课程论文 论文题目: 梯度下降算法的学习 学专学姓 院: 业: 号: 名: 指导教师: 二〇一二年十二月二十六日 摘要 梯度法,又名...
模式识别期末论文9
模式识别期末论文9 - 深圳大学研究生课程:模式识别理论与方法 课程作业实验报告 实验名称:Classification and Regression Tree 实验编号:Proj08-01 ...
模式识别论文
模式识别论文 - 手写体图片识别 学号: 姓名: 专业:通信工程 基于支持向量机的手写体数字图片识别 摘要: 手写体图片识别有多种方法, 基于支持向量机的手写体图片...
模式识别期末论文
模式识别期末论文_计算机软件及应用_IT/计算机_专业资料。模式识别模式识别的认识模式识别是对感知信号(图像、视频、声音等)进行分析,对其中的物体对 象或行为进行...
模式识别论文
模式识别论文 - 人脸识别问题是一个经典的模式识别问题。近年来,受到压缩感知理论的启发,基于稀疏表示的人脸识别技术得到了广泛研究。基于稀疏表示的人脸识别是利用...
更多相关标签: