查看文章 |
摘 要
手写体数字识别是文字识别中的一个研究课题。由于识别类型较少,在实际生活中有深远的应用需求,一直得到广泛的重视。近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务,机器自动输入等场合已经获得成功的实际应用。 对于手写体数字识别,目前已经发展了很多种方法,它们是基于神经网络算法,基于笔划特征的算法,基于遗传算法,基于小波变换算法,基于傅立叶变换算法,基于支持向量机算法和基于模板匹配算法等等。由于手写体数字识变体极多,对各类字体的数字识别特别是脱机手写数字识别仍然处于在发展阶段,识别效果仍然不够理想。因此,研究简单高效的手写数字识别依然是一个重要的研究方向。本文通过图像预处理和数字特征提取,基于神经网络的判别方法,并结合使用Matlab工具箱中提供的人工神经网络函数设计了一种手写数字识别的新方法。实验表明,该方法可以获得较好的识别率。
关键词:手写体数字识别;特征提取;人工神经网络;Matlab ABSTRACT
Handwritten numeral recognition is a branch of character recognition and attracted great attention because of its lesser classification and beneficial demand in practice. Furthermore, with the rapid development of computing technology and image processing by recent years, numeral recognition has found successful applications on business, automatic input and other fields. People have developed some methods on the research of handwritten numeral recognition nowadays. They are based on neural network, stroke feature extraction, genetic algorithm, wavelet transform, FFT transform, SVM algorithm, template matching algorithm and etc. However, numeral recognition of every kind of font, especially offline numeral recognition has still on its developing stage and the recognition rate is still not very perfect due to the variety of written styles. For these reasons, to find simple and effective methods is still a challenging task. This paper designs a new method of handwritten numeral recognition by digital image preprocessing, feature extraction based on neural network method of judgment and the combined use of Matlab toolbox for the artificial neural network function. Experiments show that the method can gain better recognition rate.
Key words:Handwritten Numeral Recognition; Feature Extraction; Artificial Neural Network; Matlab
目前,在字符识别研究中使用最广泛的是光学字符识别,即OCR方法。其统计模式识别方法注重数量特征,便于特征提取、分析和计算。但是,它将字符看成一种随机的二维点阵,没有考虑字符的结构特征和结构信息。因此,这种方法对单一字符比较有效,而对不同字体的字符识别效果则较差。结构模式识别的方法是把待识别的模式看成由若干个比较简单的子模式构成的集合,任何模式都可以用一组基元及一定的组合关系来描述。由于字符含有丰富的结构信息,可以设法提取含有这种信息的结构特征,作为字符识别的依据。但是,由于字符结构比较复杂,实际应用中仍有较大困难。近年来,出现了将统计和结构识别结合起来的途径,既吸引了统计识别的优点,又利用了字符的结构信息。手写数字识别是字符识别的一个特定方向。由于问题本身的特殊性,传统的OCR方法不能有效地解决这一问题。因此,手写数字的识别方法应该是一种具有自适应、抗干扰、能够有效地解决手写数字分割、统计模式识别与结构模式识别相结合的方法。 神经网络是一门涉及神经生理学、数理科学、信息科学等领域的交叉学科。BP神经网络的改进和应用是近年来的研究重点,改进分为网络结构本身的改进、基于梯度的改进和基于数值优化方法的改进三大方面。作为脱机光学字符识别范畴的手写体数字识别应用广泛,如大规模数据输入、金融领域中财会报表、支票识别以及邮件自动分拣等。在多种研究方法中,基于改进的BP神经网络技术有非常潜在的研究和应用前景。 神经网络技术的运用能够部分解决上述问题。神经网络具有以下几方面的优点:神经网络是自适应的,它能从数据中自动地学习到解决问题的知识。神经网络具有容错性,既能够处理与训练集中相同的数据,又能够处理不完整的数据。神经网络能够获取系统中复杂输入变量的相互关系。神经网络的识别方法可以看成是一种介于统计模式识别与结构模式识别之间的方法,既具有统计模式识别的优点,又吸收了结构模式识别的长处。从统计模式识别的角度来看,它可认为是一种估计概率分布的非参数方法;从结构模式识别的角度来看,它是一种能够隐含地利用模式的结构信息的模式识别方法。由于具备上述特点,神经网络技术能够解决传统OCR方法所不能解决的手写数字识别问题。 本文主要通过Matlab对手写数字识别进行仿真,基于人工神经网络和图像处理的方法,对手写数字进行识别。首先对识别图像进行预处理(二值化,平滑滤波,细化)等等,然后再对预处理过的图像进行特征提取,最后根据神经网络技术对提取的特征进行识别,最终判断识别结果。 以上为本篇论文部分内容,其目录图片直接从论文中剪出,有需要完整论文的网友可参阅 <<论文共享要求>>,也可直接通过QQ17304545
|
