1自动识别技术概述Word格式.docx
- 文档编号:6196632
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:54
- 大小:449.27KB
1自动识别技术概述Word格式.docx
《1自动识别技术概述Word格式.docx》由会员分享,可在线阅读,更多相关《1自动识别技术概述Word格式.docx(54页珍藏版)》请在冰点文库上搜索。
(3)磁存储。
如磁条、非接触磁卡、磁光存储、微波。
图2-1自动识别技术的分类
2.特征提取技术特征提取技术那么依照被识别物体本身的生理或行为特征来完成数据的自动采集与分析,如语音识别、指纹识别等。
按特征的类型,特征提取技术可分为以下三种。
(1)静态特征。
如视觉、能量扰动等特征。
(2)动态特征。
如声音(语音)、键盘敲击、其他感受特征。
(3)属性特征。
如化学感受特征、物理感受特征、生物抗体病毒特征、联合感受系统。
近30年来,自动识别技术在全球范围内得到了迅猛进展,初步形成了一个涵盖条码识别、射频识别、生物特征识别、图像识别以及磁识别等技术的,集计算机、光、电、通信和网络技术于一体的高技术学科。
自动识别技术的崛起,为计算机提供了快速、准确地进行数据采集和输入的有效手段,解决了计算机通过键盘手工输入数据速度慢、错误率高造成的“瓶颈”难题,因而自动识别技术作为一种先导性的高新技术,正迅速为人们所同意。
依照自动识别技术的应用领域和具体特征,本章将重点介绍条码识别、射频识别、NFC、磁卡与IC卡识别、语音识别、光学字符识别、生物识别等几种典型的自动识别技术。
2.1.3自动识别系统的构成
自动识别系统具有信息自动猎取和录入功能,无须手工方式即可将数据录入计算机。
其一般模型如图2-2所示。
图2-2一般自动识别系统模型
图2-2所示模型是在抽象的层次上概括出来的自动识别系统模型,关于有特定格式的输入信息,如条码、IC卡,由于其信息格式固定且有量化的特征,故其系统模型简单,将系统的信息处理模块对应为相关的译码工具即可。
如输入信息为包含二维图像或一维波形等的图形图像类信息,如指纹、语音等,由于该类信息没有固定格式,且数据量大,故其系统模型较复杂,能够抽象为图2-3所示的模型。
图2-3图形图像类信息的自动识别系统模型
图形图像类自动识别系统一般由数据采集单元、信息预处理单元、特征提取单元和分类决策单元构成。
数据采集单元通常通过传感技术实现,信息预处理单元是通过信息的预处理来去除或抑制信号干扰,特征提取单元那么是提取信息的特征,以便通过相关的判定准那么或经验实行分类决策。
2.2物品信息编码及识别技术
在物联网中,物品的编码对信息的收集意义重大。
为了有效地收集信息,物联网需要给全球每一个“物”都分配唯一的编码,如此“物”的身份能够通过编码来加以确定,解决信息归属于哪一个“物”的问题。
现在全球许多领域差不多开始给物品分配唯一的编码,同时出现了多个物品编码体系共存的局面。
这些物品编码体系既有早期建立的物品编码体系,也有基于物联网的物品编码体系。
物品编码体系的进展方向是今后的编码体系必须支持现存的编码体系,必须是现存编码体系的扩展,物联网最终的目标是为每一个单个物品建立全球的、开放的编码标准。
现在的物品编码体系要紧有条码编码体系、EPC编码体系和UID编码体系,其中条码属
于早期建立的物品编码体系,EPC码和UID码是基于物联网的物品编码体系。
物品编码是物品的“身份证”,解决物品识别的最好方法确实是给全球每一个物品都提供唯一的编码,通过物品编码搭建一个自动识别任何事物的全球网络——“物联网”。
2.2.1物品信息编码进展简史
1.美国统一编码委员会(UCC)
1970年,美国超级市场委员会制定了通用商品代码(UniversalProductionCode,UPC)。
UPC是一种条码,1976年美国和加拿大的超市开始使用UPC条码应用系统。
1973年,美国统一编码委员会(UniversalCodeCouncil,UCC)成立。
UCC是标准化组织,UPC条码由UCC治理。
2.欧洲物品编码协会(EAN)
1977年,欧洲物品编码协会(EuropeanArticleNumber,EAN)成立,开发出与UPC条码完全兼容的EAN条码。
1981年,EAN更名为国际物品编码协会(InternationalArticleNumberingAssociation,IAN)。
这时EAN差不多进展成为一个国际性的组织,EAN条码作为一种消费单元代码,在全球范围内用于唯一标识一种商品。
3.全球电子产品编码中心(EPCGlobal)
伴随着经济全球化的进程,需要对全球每个物品进行编码和治理,条码的编码容量满足不了如此的要求,电子产品编码(ElectronicProductCode,EPC)就应运而生了。
EPC
Global的要紧职责是在全球范围内建立和维护EPC网络,保证采纳全球统一的标准完成物
品的自动、实时识别,以此来提高国际贸易单元信息的透明度与可视性。
4.国际物品编码协会(GS1)
当UCC加入EAN后,EANInternational成立了。
2005年2月,EANInternational更名为GS1(GlobeStandard1)。
GS1不仅包括条码的编码体系,而且包括EPC码的编码体系。
目前GS1要紧用于商业领域,通过EPC码、射频识别(RFID)、互联网,能够确保全球贸易伙伴得到正确的产品信息。
5.泛在识别中心(UIDCenter)
目前全球比较成熟的物联网标准体系有欧美支持的EPC物联网标准体系和日本的
UID(UbiquitousIdentification)物联网标准体系。
EPC和UID是两种要紧的物联网标准体系,它们有各自的特征,同时相互竞争。
为了制定具有自主知识产权的物联网标准体系,UID采纳Ucode编码,它能兼容日本已有的编码体系,同时也能兼容其他国家的编码体系。
2.2.2条码技术概述
条码(Barcode)技术的核心是条码符号,由一组规那么排列的黑条、空白以及相应的数字字符组成。
条码是将宽度不等的多个黑条和空白按一定的编码规那么排列,用于表示一组信息,“条”指对光线反射率较低的部分,“空”指对光线反射率较高的部分。
这种用条、空组成的数据编码能够供机器识读,而且很容易译成二进制数和十进制数。
这些条和空能够有各种不同的组合方法,从而构成不同的图形符号,即各种符号体系(也称码制)。
不同码制的条码,适用于不同的应用场合。
条码一般有一般一维条码和二维码两种。
条码是商品的“身份证”,是商品流通于国际市场的“通用语言”。
条码能够标出物品的生产国、制造厂家、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等许多信息,因而在商品流通、图书治理、邮政治理、银行系统等许多领域都得到了广泛的应用。
1.一维条码
世界上约有225种一维条码,每种都有自己的一套编码规格,规定每个字母(可能是文
字或数字)由几个线条(Bar)及几个空白(Space)组成,以及字母的排列。
较流行的一维条码有39码、EAN码、UPC码、128码,以及专门用于书刊治理的ISBN、ISSN等。
不论哪一种码制,一维条码基本上由以下几个部分构成的。
(1)左右空白区:
作为扫描器的识读预备。
(2)起始符:
扫描器开始识读。
(3)数据区:
承载数据的部分。
(4)校验符(位):
用于判别识读的信息是否正确。
(5)终止符:
条码扫描的结束标志。
(6)供人识读字符:
机器不能扫描时用于手工输入。
(7)有些条码还有中间分隔符,如商品条码里的EAN-13、UPC-A条码等。
条码识读设备工作时,会发出光束扫过条码,光线在浅色的空上易反射,而在深色的条上那么不反射,条码依照长短以及黑白的不同,反射回对应的不同强弱的光信号,光电扫描器将其转换成相应的电信号,通过处理变成计算机可接收的数据,从而读出商品上条码的信息。
1)EAN码
EAN条码是国际物品编码协会制定的一种条码,已用于全球90多个国家和地区,超市
中最常见的确实是EAN条码。
EAN条码符号有标准版和缩短版两种,标准版由13位数字构成,即EAN-13;
缩短版由8位数字构成,即EAN-8。
我国于1991年加入EAN组织。
EAN码例如如图2-4所示。
图2-4EAN码例如
用数字“1”来表示条码的一个“暗”或“条”部分,用“0”来表示条码的一个“亮”
或“空”部分。
标准条码由厂商代码、商品项目代码和校验码三部分组成。
2)39码
39码是一种条、空均表示信息的非连续型条码,它可表示数字0~9、字母A~Z和8
个操纵字符(-,空格,/,$,+,%,·
,*)等44个字符,要紧用于工业、图书以及票据的自动化治理。
39码仅有两种单元宽度,分别为宽单元和窄单元。
宽单元的宽度为窄单元的1~3倍,
一般多项选择用2倍、2.5倍或3倍。
39码的每个条码字符由9个单元组成(5个条单元和4个空单元),其中3个单元是宽单元,其余是窄单元,故称为“39码”。
39码的特征如下。
(1)用9个条和空来代表一个字母(字符)。
(2)条形码的开始和结束(起始/终止符)都带有星号(*)。
(3)字符之间的空称作“字符间隔”,一般来说,间隔宽度和窄条宽度一样。
2.二维码一般的一维条码自问世以来,很快得到了普及并被广泛应用。
由于条码的信息容量很小,条码通常是对物品的标识,而不是对物品的描述,许多描述信息只能依赖于数据库,因而条形码的应用受到了一定的限制。
二维码能够在横向和纵向两个方位同时表达信息,因此能在很小的面积内表达大量的信息。
二维码是用某种特定的几何图形,按照一定规律在二维平面上分布的黑白相间的图形。
二维码在代码编制上巧妙地利用了二进制“0”“1”的概念,使用假设干与二进制相对应
的几何形体来表示文字和数字信息,通过图像输入设备或光电扫描设备自动识读,以实现信息的自动处理。
二维码的优点在于能在纵横两个方向同时表示信息,因此能在很小的面积上表示大量的信息,超越了字母、数字的限制,能够将图片、文字、声音等进行数字化编码,用二维码表示出来。
二维码容错能力强,即使有穿孔、污损等局部损坏,照样能够正确识读;
误码率低,能够加入加密措施,防伪性好。
二维码有以下不同结构。
(1)线性堆叠式二维码。
在一维条码编码原理的基础上,将多个一维码在纵向堆叠而产生。
典型的码制有Code16K、Code49、PDF417等。
(2)矩阵式二维码。
在一个矩形空间通过黑、白像素在矩阵中的不同分布进行编码。
典型的码制有Aztec、MaxiCode、QRCode、DataMatrix等。
目前有几十种二维码,常用的二维码有Datamatrix、QRCode、Maxicode、PDF417、Code49、Code16K等,如图2-5所示。
QR码与Datamatrix码目前应用广泛,龙贝码、汉信码那么是中国人设计的二维码,性能十分先进。
下面对这4种二维码作详细的介绍。
图2-5几种常用的二维码
1)QR码
QR码(QuickResponseCode,高速识读码)是由日本Denso公司于1994年9月研制的一种矩阵二维码。
QR码符号共有40种规格,版本1的规格为21模块21模块,版本2为25模块25模块,依次类推。
每一版本符号比前一版本每边增加4个模块,直到版本40,规格为177模块177模块。
QR码是当前应用最广泛的二维码,微信、支付宝、共享单车、动车票等都应用了这种二维码。
2)Datamatrix条码
Datamatrix要紧用于电子行业小零件的标识,两条邻边(左边的和底部的)为暗实线,形成了一个L形边界。
3)龙贝码
龙贝码(LotsPerceptionMatrixCode,LPCode),意思是大数据容量的矩阵码。
龙贝
码是我国第一个完全自主原创的、拥有底层核心算法国际发明专利的全新二维码。
龙贝码存储容量很大,目前单一符号的数据容量差不多超过300KB。
它采纳独创的特别掩模加密算法,能够对存储数据进行高达2的8960次方重加密,因此信息更安全。
另外,龙贝码是全信息多种类的信息。
龙贝码是目前全球范围内唯一能够变形的码制图形符号;
它还具备对数据分级授权识读的技术能力。
龙贝码例如如图2-6所示,其技术优势要紧有以下几个。
(1)高安全性加密,被称为零破解概率。
(2)信息容量超大,能够储存大于300KB的信息。
(3)无版本限制,是全球目前唯一的全信息码制,不受形状和版本的限制。
(4)具有超强纠错能力,能够有效地克服现有二维码抗畸变(如透视畸变、扫描速度畸变、球形畸变和凹凸畸变等)能力差的问题,具有超强识读和纠错能力。
用户可自定义纠错等级,纠错能力超过50%。
(5)码符可变形。
首创并唯一实现码符外形可变,充分适应载体介质的特征,码符尺寸及外形比例能够依照用户需求任意调整。
4)汉信码汉信码是我国拥有自主知识产权的一种二维码,是目前唯一一个全面支持汉字的条码。
汉信码是矩阵式二维码,除具有汉字编码能力强、抗污损、抗畸变、信息容量大等特点外,还支持160万个汉字信息字符,当对大量汉字信息进行编码时,相同信息内容的汉信码符号面积远远低于其他条码符号。
汉信码对一切能够二进制化的信息进行编码,能够在纸张、卡片、PVC甚至金属表面上印出,所增费用要紧是油墨的费用。
汉信码具有独立定位功能,其数据表示法为:
深色模块表示二进制1,浅色模块表示二
进制0。
汉信码的编码容量为:
数字为7827个字符,字母型字符为4350个字符,常用一区汉字为2174个字符,常用二区汉字为2174个字符,二字节汉字为1739个字符,四字节汉字为1044个字符,二进制数据为3261个字节。
汉信码可选择4种纠错等级,可恢复的码字比例分别为8%、15%、23%和30%。
汉信码符号是由nn个名义正方形模块构成的正方形阵列,该正方形阵列由信息编码区、功能信息区和功能图形区组成,其中功能图形区要紧包括寻像图形、寻像图形分隔区、校正图形和辅助校正图形。
汉信码码图符号的四周为许多于3模块宽的空白区。
汉信码符号共有84个版本,版本1的规格为2323模块,版本2为2525模块,依次类推,每一版本符号比前一版本每边增加2个模块,直到版本84,其规格为189189模块。
汉信码例如如图2-7所示。
3.条码的代码形式
条码由欧洲物品编码协会(EAN)和美国统一编码委员会(UCC)负责治理,要紧有6种代码形式,前面谈到的一维条码和二维码都包含在这6种代码形式中。
这6种代码形式分别为全球贸易项目代码(GTIN)、系列货运包装箱代码(SSCC)、全球参与方位置代码(GLN)、全球可回收资产标识代码(GRAI)、全球单个资产标识代码(GIAI)和全球服务关系代码(GSRN),如图2-8所示。
其中,GTIN和SSCC为常用的两种代码形式。
图2-8条码的要紧构成
1)全球贸易项目代码(GTIN)
GTIN(GlobalTradeItemNumber)是为全球贸易提供唯一标识的一种代码,是目前使用最多的一种条码。
GTIN由14位数字构成,是EAN与UCC的统一代码。
GTIN经常贴在商品包装箱或包装盒上,与资料库中的交易信息相对应,在供应链的各个环节流通。
GTIN有4种不同的编码结构,分别为EAN/UCC-14、EAN/UCC-13(即EAN-13码)、
EAN/UCC-8(即EAN-8码)和EAN/UCC-12编码结构,其中后3种编码结构通过补零能够表示成14位数字的编码结构。
条码一般由国家前缀码(也称国家代码)、厂商代码、商品项目代码和校验码组成,条码的赋码权由国际物品编码协会、各国的物品编码组织、厂商共同拥有。
条码的前缀码用来标识国家或地区,国际物品编码协会具有前缀码(国家代码)的赋码权。
各个国家或地区的物品编码组织具有厂商代码的赋码权,我国的物品编码组织是中国物品编码中心(ANCC)。
商品项目代码的赋码权由厂商自己行使,即厂商具有商品项目代码的赋码权。
条码的最后1位为校验码,校验码用来防止条码被误读,假如读出的条码数据与对应的校验码不匹配,那么系统将认为条码出现错误。
EAN条码有标准版(EAN-13)和缩短版(EAN-8)两种。
标准版用13位数字表示,又称为EAN-13码;
缩短版用8位数字表示,又称为EAN-8码。
EAN-8码和EAN-13码的位分配方法见表2-1和表2-2。
表2-1EAN-8码的位分配方法
国家代码
厂商代码
校验码
第1~3位
第4~7位
第8位
表2-2EAN-13玛的位分配方法
商品项目代码
第1~3位(我国EAN码的前3位是690、691、692)
第4~7位
第8~12位
第13位
例如,罐装健力宝饮料的条码为6901010101098,其中690代表中国、1010代表广东健力宝公司、10109是罐装饮料的商品项目代码、8为校验码。
又如,69012341为8位的EAN-8代码,其中国家代码为690、厂商代码为1234、校验码为1。
图书和期刊作为特别的商品,也采纳了EAN-13码。
图书和期刊的前缀分别表示为ISBN和ISSN,其中前缀ISBN978用于图书号,前缀ISSN977用于期刊号。
以图书为例,我国图书使用7开头的ISBN号,因此我国图书的条码均以ISBN9787开头。
2)系列货运包装箱代码(SSCC)
SSCC(SerialShippingContainerCode,系列货运包装箱代码)是为了便于运输和仓储而建立的临时性组合包装代码。
SSCC在供应链中用于对包装箱个体的跟踪与治理,能使
物流单元的实际流动被跟踪和记录,可广泛应用于运输行程的安排和自动收货等。
SSCC的
长度为18位,码的位分配方法见表2-3。
表2-3SSCC的位分配方法
扩展位
第1位
第2~4位
第5~8位
第9~17位
第18位
例如,006141410009997778为18位的SSCC代码,其中扩展位为0、国家代码为061、厂商代码为4141、商品项目代码为000999777、校验码为8。
2.2.3条码识别系统处理流程
条码识别是集条码理论、光电技术、计算机技术、通信技术和条码印制技术于一体的自动识别技术,可靠性高、输入快速、准确性高、成本低、应用面广,能够标出物品的生产国、制造厂家、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等许多信息,因此在商品流通、工业生产、图书治理、邮政治理、仓储治理、银行系统、信息服务等许多领域都得到了广泛的应用。
条码识别技术是最早应用的一种自动识别技术,属于图形识别技术。
一个典型的条码系统处理流程如图2-9所示。
不管是一维条码、二维码,其系统基本上由编码、印刷、扫
描识别和数据处理等几个部分组成。
条码编制
条码印刷
条码阅
解码信息
计算
输出
软件生成
读器扫
机处
条码
描条码
理
信息
图2-9条码系统处理流程
1.条码的编制和印刷
条码是一种图形化的信息代码。
一个具体条码符号的产生要紧有两个环节,一个是条码符号的编制,另一个是条码符号的印刷。
这两个环节涉及条码系统中的条码编制程序和条码打印机。
任何一种条码都有相应的物品编码标准,从编码到条码的转化,能够通过条码编制软件来实现。
商业化的条码编制软件有BarTender和CodeSoft等,能够编制一维条码和二维码,让用户方便地制作各类风格的证卡、表格和标签,而且还能实现图形压缩、双面排版、数据加密、打印预览和单个/批量制作等功能,生成各种码制的条码符号。
条码编制完成后,需要靠印刷技术来生成。
因为条码是通过条码识读设备来识别的,这就要求条码必须符合条码扫描器的某些光学特征,因此条码在印制方法、印制工艺、印制设备、符号载体和印制涂料等方面都有较高的要求。
条码的印刷分为两大类,即非现场印刷和现场印刷。
非现场印刷确实是采纳传统印
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自动识别 技术 概述