BP神经网络进行手写体字母数字识别.docx
- 文档编号:5458323
- 上传时间:2023-05-08
- 格式:DOCX
- 页数:9
- 大小:111.69KB
BP神经网络进行手写体字母数字识别.docx
《BP神经网络进行手写体字母数字识别.docx》由会员分享,可在线阅读,更多相关《BP神经网络进行手写体字母数字识别.docx(9页珍藏版)》请在冰点文库上搜索。
BP神经网络进行手写体字母数字识别
人工智能及识别技术本栏目责任编辑:
唐一东应用BP神经网络进行手写体字母数字识别
国刚,王毅
(青岛广播电视大学,山东青岛266012
摘要:
该文提出了一种采用BP神经网络方法来对无限制手写体字母、数字进行识别的方案。
在选取合适的特征点的基础上,对手写体图像进行分域处理,每一小区域对应输入层的一个神经元。
测试结果表明,该识别方案具有很强的抗畸变、抗旋转能力。
关键词:
神经网络;误差反传;字符识别
中图分类号:
TP183文献标识码:
A文章编号:
1009-3044(200833-1459-02
RecognizeUnconstrainedHandwrittenCharactersinBPNeuralNetwork
GUOGang,WANGYi
(QingdaoTVUniversity,Qingdao266012,China
Abstract:
Thispaperintroducesneuralnetworktorecognizeunconstrainedhandwrittencharacters.Onthebasisofappropriatefeatureex-traction,handwrittenimagesegmentationsaremade.Everypartcorrespondstoaneuralcellofinputlayer.Experimentalresultsshowthatthismethodhastheabilityofrotationalvariance-resistance.
Keywords:
neuralnetwork;BP;characterrecognition
1引言
字符识别长期以来都是采用传统的识别方法,对印刷体字符的识别率一般只是稳定在96%左右,未能进一步提高,而对手写体字符的识别,其研究还处于探索阶段,其识别率还相当低,因此,为了提高识别率,就必须寻求新的方法和途径。
20世纪80年代中期,人们已经开始利用人工神经网络解决手写体数字识别问题。
人工神经网络为OCR研究提供了新的手段,它具有一些传统技术所没有的特点:
1具有很强的分类能力,可以在特征空间内形成任意复杂的决策区域;2硬件实现后的神经网络分类速度比传统方法快得多;3分类器便于训练,无需人为过多的干预。
特别是对手写体字符识别问题,神经网络技术更显示出独特的优越性。
目前研究的神经网络字符识别系统可划分为两大类.第一类系统实际上是传统方法与神经网络技术的结合,这也是本文采用的方法.这类系统分为两块,第一块主要完成样本模式预处理和字符特征抽取任务,第二块是用前面获得的模式特征来训练神经网络分类器,从而达到识别字符的目的。
这类系统充分利用了人的经验来获取模式特征以及神经网络的杰出分类能力来识别字符,是人们通常采用的方法。
第二类系统省去了特征抽取工作,整个字符直接作为神经网络的输入,这类系统的神经网络结构的复杂度大大增加了,首先输入模式维数的增加导致网络规模的庞大,使得网络的训练、学习非常困难。
此外神经网络结构上要消除模式变形的影响。
通常这类网络都采用局部连接的方式减少网络的复杂度,并采用共享连接权的策略增强网络抗变形(输入模式的能力。
由于人工神经网络具有并行处理和很强的容错性等特点,因此有可能大大提高手写体字母数字识别的准确率和速度。
目前神经网络手写体字母数字识别系统的识别水平已与传统模式方法相当,且大有提高的余地。
本文阐述了利用BP网络进行手写体字母(小写、数字识别的一些尝试,取得了令人满意的测试结果。
2预处理和特征抽取
2.1样本集的获取和预处理
实验中所用的手写体数字样本集由1000个数字组成,它们是在屏幕上随意书写后,由象素点提取程序提取数据并存入磁盘文件,每个数字由6×8的网格数据组成。
实验中所用的手写体小写字母样本集由400个字母组成,它们也是在屏幕上随意书写后,由象素点提取程序提取数据并存入磁盘文件,每个数字由8×10的网格数据组成。
图1给出了部分原始数字图象和处理后的图像样本和部分原始字母图像和处理后的图像样本。
2.2特征提取方法
字符是由弧线和直线构成的,弧线的弯曲方向和程度不
同,字符的形状也就不一样。
但是同一类不同形状的字符,它
的端点数、交叉点数,点与点之间的相对位置及弧线的弯曲方
向基本上是稳定的。
而这些特征反映了字符的拓扑结构,是字
符的重要特征。
我们所采用的特征提取方法是:
在手写(用鼠标模拟过
程中,由于鼠标会在屏幕上留下轨迹,所以只要从鼠标按键到
鼠标起键,分别记录下鼠标经过的最大最小横纵坐标值,就可收稿日期:
2008-08-20
作者简介:
国刚(1979-,男,山东青岛人,讲师,硕士,主要研究方向:
数据仓库和数据挖掘理论及相关应用;王毅(1972-,女,工学
学士
。
图1部分原始图象和处理后图像样本
ISSN1009-3044
ComputerKnowledgeAndTechnology电脑知识与技术
Vol.4,No.6,November2008,pp.1459-1460,1465E-mail:
eduf@Tel:
+86-551-569096356909641459
ComputerKnowledgeAndTechnology电脑知识与技术2008年第4卷第6期(总第33期
以分别将数字、字母划分为6×8和8×10的结构(如图1所示。
在确定好字符所占的区域之后,对于每一个网格,按照12×16的点阵提取象素点,如果在12×16的点阵上存在象素点的象素值为字体颜色,则认为相应网格取值为1,否则取值为0。
例如:
图1中数字2提取的特征值为:
0011100100100000100000100001100011000110001111111
字母a提取的特征值为:
00111000010011000100010010000100100001001000110010011100110101000110001000000001
所得到的数据作为神经网络输入层的输入数据。
在生成训练集时,不但要把上述数据存入磁盘文件,同时,还要将目标值(数字2和字母a也分别写入磁盘文件,作为训练集数据。
3识别和训练
3.1神经网络的结构及其优化
我们采用的是误差反向传播的BP网络,选一层隐含层,网络结构如图2所示。
输入层神
经元的数目即为输入样本的维数(数字48,字母80,输出层的神经元数目为10(数字和26
(字母,分别对应10个数字和26个字母。
至于隐含层神经元数目目前只有在实验的基础上
经验选取,在实验中,我们将数字识别神经网络的隐含层神经元设置为20,字母的设置为40。
3.2识别的实现
构造48×20×10的前馈BP神经网络模型用于数字识别(字母识别用的是80×40×26。
输入层含有48个神经元,对应图像被划分为48个小区域,每个神经元取值范围可为0或
1。
若取0,表明该区域内不含任何图像信息,若取1,表明该区域内含有图像信息。
输出层
是10个神经元,对应10个数字,隐含层是20个神经元。
所有神经元都采用Sigmoid特性,
即。
网络输出误差的度量采用均方误差准则,即。
式中Ti为第
三层(输出层第i个神经元的目标输出;ViL为输出层第i个神经元的实际输出。
网络采取全连接的方式,它的自适应过程采用误差逆向传播(EBP的学习规则,学习过程中各神经元之间的连接权重按下列关系进行调整:
W(n=W(n-1+ΔW(W(n为第次迭代中的权重值,ΔW为本次权重调节量
对于输出层,权重调节量为:
ΔWqm(n=ησmVq+μΔWqm(n-1(η为学习率0<η<1、μ为惯性系数0<μ<1
其中,σm=(Tm-Vm(1-VmVm(T为目标向量,V为输出层输出向量
对于隐含层,权重调节量为:
ΔWij,k(n=ησi,kVj,k-1+μΔWij,k(n-1(η为学习率、μ为惯性系数
其中,σi=f'(JiΣ
h
σhWih(假定神经元h在K+1层上,i在K层上,j在K-1层上
本实验中,经调试发现,取η=0.1,μ=0.4时,学习与收敛速度为最佳。
3.3网络的训练
训练程序中,将随机数函数产生的随机数作为本次训练的记录序号,从训练集中取出输入向量以及目标向量,根据上面的误差反传算法调整网络神经元之间的权重,每次训练10000次,所得到的误差如图3、图4所示
:
图3自动训练10000次(约80秒后误差图4自动训练20000次(约160秒后误差
4结论
本系统对数字的识别率相当高,平均识别率达到98%,而对小写字母的识别率则较低些,但平均识别率仍可达到90%。
分析认为,对于数字识别所使用的训练集比较大,有1000多条,而用于小写字母识别的训练集则比较小(产生训练集比较繁琐,仅有300多条,是产生这个差别的原因。
实验结果图如下
:
图5图6
(下转第1465页
图2BP网络结构
1460
本栏目责任编辑:
唐一东人工智能及识别技术
人工智能及识别技术本栏目责任编辑:
唐一东(上接第1460页
本系统采用VisualBasic6编写,在Windows2000环境下调试通过。
实验结果表明,本系统具有运算速度快,识别率较高的特点。
数字的平均正确识别率达98%,字母的平均正确识别率在90%左右,并具有良好的容错能力。
如果让系统学习更多的样本,则识别率将会进一步提高。
参考文献:
[1]
冯天瑾.神经网络技术[M].山东:
青岛海洋大学出版社,1994:
44-50.[2]
施善昌.自动识别原理与应用[M].北京:
人民邮电出版社,1989[3]
曹焕光.人工神经元网络原理[M].北京:
气象出版社,1992[4]
焦李成.神经网络系统[M].西安:
电子科技大学出版社,1990[5]
王明会,潘新安.神经网络在手写体数字识别中的应用[J].通信学报,1992,13(5:
60-64.[6]
HaykinS.神经网络的综合基础[M].2版.北京:
清华大学出版社,2001:
156-252.[7]王伟.人工神经网络原理———入门与应用[M].北京:
航空航天大学出版社,1995.
置取反。
这样,对每一代群体,我首先用协调条件进行一次筛选,剔除不满足协调条件的个体。
然后才对个体进行演化计算产生下一代,从而加快了进化速度。
结合上述三种算子,采取了一种新的遗传策略。
在得到群体中每个个体的适应值后,首先用轮盘赌方法将群体选择到交配池中,然后从交配池中每次取两个个体依概率进行杂交或变异产生临时新群体,此时,临时新群体数目与父代群体数目相同。
接着,再将临时新群体中每个个体依概率选择或直接复制到下一代,或与上一代对应个体进行竞争(即若其适应值比上一代对应个体差,则将上一代个体保留下来,否则将其保留至下一代。
另外,将每一代中最优个体进行保存,每次产生新群体后,判断新群体中是否有比现有最优个体的适应值更好的,若有,则用其替换当前最优个体。
通过父代和子代竞争,可以提高解的收敛速度。
4.5停机准则
我可以采用多种方法来结束算法的执行,这里,我采用两种方式相结合对停机加以控制:
1设定最大遗传代数M,当遗传进行到第M代时,让其停机。
2预先定义评价函数的一个指标数,当某一代最优个体的适应值达到或超过该指标数时,让其停机。
4.6输出结果
遗传算法结束后,可以得到适应值(即综合效率函数值最好的个体。
根据这个结果,我将对个体码进行如下分解:
1分解个体码成为表单元码。
2分解每一个表单元码成为:
班级码、课程码、星期码、时段码、教室码。
由分解后的班级码、课程码、星期码、时段码、教室码分别生成如下表格:
1班级课程表。
2根据教师与课程的固定关系,生成教师工作表。
3每个教室的时间占用表。
4教学单位的课程总表。
5结束语
本文基于遗传算法建立和描述了排课的数学模型,实际上是对一个时间任务表的优化问题,研究了对问题的求解。
利用遗传算法的全局寻优和收敛速度快的特点,结合随机选取法和回溯试探法的优点,设计了一种用于课表自动生成的好的算法,在排课的成功率和速度都得到了明显的提高。
实验表明:
本排课模型算法的构成结果能得到较满意的课程表安排方案。
然而要使课表自动生成的误差精度和收敛速度进一步得到改进,还需要做出更深的研究。
参考文献:
[1]
PeterBrucker.SchedulingAlgorithm.Berlinetc:
Springer,1998.[2]
J.H.Holland,Adaptationinnaturalandartificialsystems[M],Annarbor:
UniversityofMichigenpress,1975.[3]
HamiltonMA.JavaandtheShifttoNet-centricComputing.IEEEComputer,29(8,1996.[4]
刘勇,康立山,陈毓屏.非数值并行算法(第二册-遗传算法[M].北京:
科学出版社,1998.[5]
余建桥,预测模型获取的遗传算法研究[J].计算机科学,1998,25(2:
12-14.[6]
王小平,曹立明.遗传算法-理论、应用与软件实现[M].西安:
西安交通大学出版社,2002.[7]
张宗华,张伟,赵霖.利用遗传算法实现交通信号灯的控制[J].计算机科学,2002.29(9.增刊:
178-181.[8]田奕,刘涛,李国杰.求解可满足性问题的一种高效遗传算法[J].模式识别与人工智能,1996.9:
209-212.
乔岸红:
一种基于遗传算法在编排课程表中的应用
1465
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- BP 神经网络 进行 手写体 字母 数字 识别