ocr技术及其应用.pptx
- 文档编号:9695847
- 上传时间:2023-05-20
- 格式:PPTX
- 页数:28
- 大小:1.55MB
ocr技术及其应用.pptx
《ocr技术及其应用.pptx》由会员分享,可在线阅读,更多相关《ocr技术及其应用.pptx(28页珍藏版)》请在冰点文库上搜索。
OCR技术及其应用,教学课件,1,OpticalCharacterRecognition,文档图像,电子文档,教学课件,2,字符识别的历程,教学课件,3,概念的提出始于1929年国内的研究从70年代才开始,目前已经达到国际先进水平,其中汉字工作识别技术已经位居国际领先,字符识别的类型,脱机,联机,教学课件,4,银行领域的应用,教学课件,5,税务领域的应用,-34*-31*8*108*5/+425-0*975*3880029825-,教学课件,6,电子政务领域的应用,教学课件,7,电子公文审批与流转电子公文的识别与查询,OCR应用的技术组成,图像处理,版面分析,版面还原,格式化输出,字符分割,表格识别,字体识别,语义后处理,字符识别,教学课件,8,图像处理,教学课件,9,去噪声、平滑、去黑边、倾斜校正等,教学课件,10,版面理解,教学课件,11,表格识别,教学课件,12,字符分割,行分割字分割,教学课件,13,字符识别,教学课件,14,字体识别,宋体仿宋黑体楷体隶书魏碑圆体,教学课件,15,语义后处理,泼,木,岁,济,平,光,先,疥,天,大,发,限,屏,永,示,晨,乒,年,本,乎,讳,屠,水,严,绳,经,先天,中固,光大,图解,本年,水平,印囤创午固的中国,经济,发展,展,教学课件,16,中国的经济发展水平中国触结申围徘绪牛图解络,格式化输出,教学课件,17,目前挑战性的课题,教学课件,18,脱机手写汉字识别超大字符集的印刷字符识别非定制版面分析,OCR涉及的模式识别问题,教学课件,19,一致性假设在统计意义下,一般假设:
样本与分类对象具有同分布。
给定的所有分类对象独立同分布。
样本的分析,教学课件,20,决策对样本空间划分的有效性。
推广能力:
决策对分类对象的有效性。
贝叶斯决策理论,教学课件,21,已知的先验概率需要决策的类别数是一定的基于模型的方法,人工神经网络,教学课件,22,缺乏充分的理论基础局部极小点问题过学习与欠学习的问题,支持向量机,教学课件,23,统计学习理论一种专门研究小样本统计学习规律的理论九十年代初取得重要进展,核技术,教学课件,24,可以证明,一定存在一个映射,称为核函数,将在欧式空间定义的样本映射到特征空间(一个更高维的空间),使得在特征空间上,样本构成两个不相交的闭凸集。
研究核函数选择的技术称为核技术。
对比测试,教学课件,25,弱分类器,教学课件,26,如果一个分类器的分类能力(泛化)稍大于50%,这个分类器称为弱分类器。
这意味着,比掷硬币猜正面的概率稍好,就是弱分类器。
集成,教学课件,27,采用投票的方式决定新样本类别。
由于每个分类器的分类能力不同,在集成时,需要对所有分类器加权平均进行分类。
1990年Shapire证明,如果将多个弱分类器集成在一起,它将具有强分类器的泛化能力。
谢谢!
教学课件,28,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ocr 技术 及其 应用