模式识别综述与展望.docx
- 文档编号:13929514
- 上传时间:2023-06-19
- 格式:DOCX
- 页数:12
- 大小:141.83KB
模式识别综述与展望.docx
《模式识别综述与展望.docx》由会员分享,可在线阅读,更多相关《模式识别综述与展望.docx(12页珍藏版)》请在冰点文库上搜索。
模式识别综述与展望
模式识别综述与展望
(控制理论与控制工程)
OverviewandProspectonPatternRecognition
ABSTRACT:
Thepatternrecognitionistheprocesstoprocessandanalysevariousform(value,writingandlogicalrelation)ofinformationwhichattributestothethingorthephenomenon,soastodescribe,identify,classifyandexplainthethingorthephenomenon,whichistheimportantcomponentoftheinformationscienceandtheartificialintelligence.Thispaperintroducesthedifferenceandlinksbetweenthepatternrecognitionandtheknowledgeguidancepatternrecognitionsystem,andtheapplicationofthepatternrecognitionanditsdevelopmentpotential.
KEYWORDS:
PatternRecognition;InformationScience;ArtificialIntelligence;KnowledgeGuidance
摘要:
模式识别是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
文章介绍了模式识别和知识引导的模式识别系统的区别和联系、模式识别的应用及其发展潜力。
关键词:
模式识别;信息科学;人工智能[2];知识引导
1引言
模式识别(PatternRecognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。
随着20世纪40年代计算机的出现以及50年代人工智能的兴起,人们当然也希望能用计算机来代替或扩展人类的部分脑力劳动。
(计算机)模式识别在20世纪60年代初迅速发展并成为一门新学科[3]。
模式识别研究主要集中在两方面:
一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴;二是在给定的任务下,如何用计算机实现模式识别的理论和方法。
前者是生理学家、心理学家、生物学家和神经生理学家的研究内容,后者通过数学家、信息学专家和计算机科学工作者近几十年来的努力,已经取得了系统的研究成果。
模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。
它与人工智能、图像处理的研究有交叉关系。
例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。
又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。
本文将介绍传统的模式识别和知识引导的模式识别系统的区别和联系、模式识别的应用及其近乎无限的发展潜力。
2传统的模式识别方法——统计方法与句法方法
把图像或图像系列分割为线条、边缘,结点,区域等并提供相应的特征,诸如灰度值、颜色、形状、纹理,深度等[5]。
目的是要利用这些信息对模式进行分类或者对模式进行分析(描述)。
分类是实现一个模式与一个类别号的对应。
分析(描述,解释)则是实现一个模式与一个符号描述的对应。
模式分析一般包括:
解释模式的组成部份,说明各个组成部份的时间和空间关系,甚至给出作出特定解释的理由。
2.1用统计方法发展起来的模式识别系统如图一所示。
图一统计模式识别系统
在用统计方法研究模式识别问题时,大体上侧重于特征抽取与选择以及模式分类与学习两个方面。
(一)特征选择与特征抽取
特征选择与特征抽取的一般方法主要分为两种:
特征空间变换以及信息和距离的测度。
特征空间变换这个方法目的是将原始特征空间变换为较低维数的特征空间,以便于模式的表示与模式的分类。
当着眼于模式表示时,常用最小均方误差与嫡准则作为确定最优变换的最佳准则。
当着眼于分类判别时,往往以最大类间距离和最小类内距离为最佳准则。
至于变换方法本身可以是线性的也可以是非线性的。
可利用的变换有:
Courier变换,Welsh-Hallmark变换,Mar变换。
为了压缩特征空间的维数常利用Karhunen-love展开式和主分量分析法[7]。
衡量变换结果好坏的标准之一是要看是否增加模式类的可分性。
就增加模式类的可分性而言,一般非线性变换比线性变换好。
然而就计算复杂性而言,。
线性变换要比非线性变换简单得多。
信息和距离的测度与识别率的上界和下界有关。
为了比较各种信息和距离的测度,Can't以误识率的上界为准则,把各种信息和距离测度的定义按其重要性以递增顺序排列起来。
对于两个模式类的识别问题,这个顺序是:
就计算的困难性而言,计算Bhattacharyya距离比计算其他距离测度要容易些。
(二)分类和学习
对模式进行分类和描述是模式识别系统的根本目标。
对于每类模式,当已经知道或者虽不确切知道但能精确估计出其特征向量的条件概率密度函数时(亦称类密度函数),就可以导出贝叶斯分类规则,它使平均风险或误识率最小。
实际上,当可以得到大量模式样本时,可以比较精确的估计出类密度函数,或者从样本学习到类密度函数。
比较实用的非参数分类方案有:
最近邻分类规则(NN规则)和K最近邻分类规则(K-NN规则,以及其他种种变态的NN规则。
非参数分类方案一般是从样本中直接学习分类规则[12]。
学习类密度函数或判决边界线的方法可以用Lesbian估值法、随机逼近法、势函数法等。
Littler研究了一种将判函数归入模式特征空间的一个子空间的方法,它可以在缺少任意数目的分量的情况下使模式分类仍为最佳(平均方差最小)。
对于无人管理的学习,特别是模式的类射数不确切知道时,这时的分类就是集群分析。
各种相似性和距离测度都可用作集群划分的准则。
集群划分准则和集群参数的选择往往需要探索性地或交互式地进行[13]。
2.2运用句法(或结构)方法的模式识别系统的框图如图二所示。
图二句法模式识别系统
图中的“基元”类似于统计方法中的特征。
在句法方法中。
用一个“句子”表示一个模式。
句子构成语言语言具有特定的文法。
文法就是用基元构成模式的规则。
文法推断是一个总结由基元构成模式的规律性。
从而得到规则即文法的过程,类似于学习。
句法分析则是分析输入模式是否符合某种文法规则的过程。
也就是分析能否用该文法生成输入模式。
分析结果为肯定则对输入模式完成了分类。
分析结果为否定,则拒绝输入模式。
也可以用关系图来表示模式结构信息。
(一)基元选择和基元抽取
通常需在基元抽取的复杂性和文法复杂性两者之间折衷,也可以用曲线线段的长度和曲率等表示曲线线段的特征。
对于区域范围的模式,一个区域内存在两个特征互异的子区域时称这个区域为边缘,存在着小于一定距离的两个边缘时称这个区域为线,边缘闭合时称为区。
常用的特征可以取灰度特征。
也可以用形状和纹理测度来描述区域。
其他还有一些方法亦可用来描述图像基元,例如灰度矩阵、灰度共生矩阵、梯度共生矩阵、点测度等。
(二)文法
已经有了各种专门的语言来描述特定的模式。
例如描述中外文字字符、染色体图像、火花室图像、二维数学化学结构、颈动脉脉冲波形、二维飞机外形、口语单词、指纹图像等。
对于多维模式,用多维文法来描述。
其他如网状文法(web)、图文法、树文法、形状文法等都已有了应用。
有两个因素决定了文法的选择,一个是所选基元的情况,另一个是要权衡文法的描述能力与文法分析的效率。
在实际应用中,往往存在某些不确定性。
例如测量中的噪声和抖动会引起分割误差和基元抽取误差,从而使描述模式的语言产生二义性。
在二义性存在的情况下,可以用随机语言来描述模式。
产生随机语言的文法称作随机文法。
在随机文法中引进了概串方法,即用具有概率分布的语句来描述模式。
(三)句法分析
在选择文法时需考虑文法的描述能力与句法分析复杂性之间的矛盾。
同样,在研究句法分析问题时,也应考虑如何从句法分析的角度处理这种矛盾。
进行分析的识别器就要采用由扩充的或变换的模式文法组成的识别器,这时分析器的效率显然会降低很多。
事实上,要在提高纠错能力和降低分析效率之间进行权衡,实际困难较大。
在句法分析中,还可以采用距离或加权距离的方法。
利用两个语句之间的距离或加权距离作为两个模式之间相似性的测度,只要有了相似性测度就可以应用现有的任一种搜索集群的方法作集群分析。
这也是一种无人管理的方法。
完成集群分析以后,就可以应用文法推断技术来推断每一个群的文法,并构造出相应的句法分析器。
3知识引导的模式识别
模式识别过程可以看成是下面的规则:
描述:
:
>识别类
在统计决策理论方法中,描述通常是一些解析表达式。
表达式中包含先验地选取的变量集合,这些变量分布于整个决策空间中。
当被研究模式的特征不是数值特征,而变量之间存在互相强烈依赖的各种关系时。
决策理论方法就显得不太适用。
在这样的情况下,可以用结构方法。
决策理论方法和句法方法两着几乎没有利用被研究问题的语义信息。
所以它们能表现和识别的模式类别是有限制的。
在设计模式识别系统时,不但要充分利用模式的数值特征和结构特征。
还需要利用和问题有关的知识来描述和分析模式,这种理论系统和方法适宜于处理各种类型的描述,它能充分地利用问题的语义,并且能较好地满足人们在易于接受方面的要求。
这种系统能表现被研究问题的知识,具有演绎、归纳能力。
所以它能产生不包含在原始特征中的新描述,并能给出演绎推理的过程。
这种新型的模式识别系统称为知识(或规则)引导的模式识别系统[15],其系统结构如图三所示
图三知识引导的模式识别系统
由知识引导的模式识别系统应由下面几个部份组成:
特征抽取部份、数据库、知识库、演绎机构以及控制机构。
特征抽取部分负责抽取模式的数值特征与关系特征。
数据库有定义、加载、修改、检索等模块。
由于数据库具有完备的数据结构,对每个关键属性设有索引。
知识库中包含有事实和规则。
事实用来描述被研究的模式,规则是关于被研究的模式和模式之间关系的一般性描述〕这些事实与规则和具体问题紧密相关。
演绎和控制机构是知识引导的模式识别系统的重要部份。
根据问题所处的当前状态,控制机构选择合适的规则进行演绎和推理。
随着研究的发展,被研究的对象变得复杂起来。
就出现了以模型为基础的视觉识别技术。
例如,Mockworth提出的方案,认为识别过程是个感知循环。
在这个方案中,识别是个叠代过程:
精细地描述模型、发现提示、引用模型、验证模型。
根据各种拓扑图像,提炼出提示。
4模式识别的应用
模式识别可用于文字和语音识别、遥感和医学诊断等方面。
(一)文字识别
汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋所以在信息技术及计算机技术日益普及的今天,如何将文字方便、快速地输入到计算机中已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我国得到普及的应用。
目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。
到目前为止,除了脱机手写体数字的识别已有实际应用外,汉字等文字的脱机手写体识别还处在实验室阶段。
(二)语音识别
语音识别技术技术所涉及的领域包括:
信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
近年来,在生物识别技术领域中,声纹识别技术以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安验证方式。
而且利用基因算法训练连续隐马尔柯夫模型的语音识别方法现已成为语音识别的主流技术,该方法在语音识别时识别速度较快,也有较高的识别率。
(三)遥感
遥感图像识别已广泛用于农作物估产、资源勘察、气象预报和军事侦察等[17]。
(四)医学诊断
在癌细胞检测、X射线照片分析、血液化验、染色体分析、心电图诊断和脑电图诊断等方面,模式识别已取得了成效[19]。
5模式识别技术的近乎无限的发展潜力
模式识别技术是人工智能的基础技术,21世纪是智能化、信息化、计算化、网络化的世纪,在这个以数字计算为特征的世纪里,作为人工智能技术基础学科的模式识别技术,必将获得巨大的发展空间。
在国际上,各大权威研究机构,各大公司都纷纷开始将模式识别技术作为公司的战略研发重点加以重视。
(一)语音识别技术
语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
中国互联网中心的市场预测:
未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过30%的速度增长。
(二)生物认证技术
生物认证技术本世纪最受关注的安全认证技术,它的发展是大势所趋。
人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来标识身份与保密。
国际数据集团(IDC)预测:
作为未来的必然发展方向的移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到100美元的市场规模。
(三)数字水印技术
90年代以来才在国际上开始发展起来的数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。
IDC预测,数字水印技术在未来的5年内全球市场容量超过80亿美元。
6结语
模式识别从20世纪20年代发展至今,并不是要对所有模式识别问题都适用的单一模型和解决识别问题,而是结合具体问题把统计的和句法的识别结合起来,把统计模式识别或句法模式识别与人工智能中的启发式搜索结合起来,把统计模式识别或句法模式识别与支持向量机的机器学习结合起来,把人工神经元网络与各种已有技术以及人工智能中的专家系统、不确定推理方法结合起来,深入掌握各种工具的效能和应有的可能性,互相取长补短,开创模式识别应用的新局面。
参考文献:
[1]边肇祺,张学工.模式识别(第二版)[M].北京:
清华大学出版社,2000-01.
[2]FU,K.S.TheRecentDevelopmentofPatternRecognitions.
[3]熊承义.李玉海统计模式识别及其发展现状综述[期刊论文]-科技进步与对策2003(8).
[4]王碧泉.陈祖荫模式识别理论、方法和应用1989.
[5]FU,K.S.SyntacticPatternRecognition,AcademicPress.NewYou'd.
[6]程勇.傅德胜基于图像区域特征的细胞识别方法及实现2003.
[7]王守觉,李兆洲,陈向东,王柏南,通用神经两络硬件中神缀元基本数学模型的讨论[J]电子学报2001,29(5):
577—59。
[8]沈清,汤森.模式识别导论[M].长沙:
国防科技大学出版社,1987.
[9]戚飞虎.模式识别与图象处理[M].上海:
上海科学技术出版社,1998.
[10]TangYuanY,TaoTue.Newmethodforfeatureextractionbasedonfractalbehaviour[J].PatternRecognition,2002,55(5):
1071-1101
[11]DandelionC,CapitalKK.Fastfeatureextractionmethodforrobustfaceverification[J].ElectronicLetters,2003,38(25)
[12]ChenLi,YapMon-Tue.AfuzzyK-nearest-neighbouralgorithmtoblindimagedeconvolution[A].IEEEInternationalConferenceonSystems,ManandCybernetics,2003.
[13]苏芳,洪文.贝叶斯融合在SAR图像分类中的应用[J].电子学报,2003,31(7)
[14]范昕炜.支持向量机算法的研究及其应用[D].浙江大学,2003.
[15]吴艳冬.复杂背景的人脸检测与定位[D].大连理工大学,2004.
[16]He'sLabour,WeiBackup.Imageanalysisforyou'recharacterization[J].ChineseJournalofElectronic,2003.
[17]HaveBin,TueMon.Supportvectormachineanditsapplicationinhandwrittennumeralrecognition[A].Proceedingsof15thInternationalConferenceonPatternRecognition,2000-02.
[18]卫保国,王爱民,沈兰荪.一种新的多类模式识别支撑矢量机[J].模式识别与人工智能,2002.
[19]统计学习理论的本质[M].张学工,译.北京:
清华大学出版社,2000.
[20]孙丽华.中文文本自动分类的研究[D].哈尔滨工程大学,2002.
[21]王守觉.仿生模式识别(拓扑模式识别)——一种模式识别新模型的理论与应用[J].电子学报,2003.
[22]王宪保.基于仿生模式识别的人脸身份确认研究[D].浙江工业大学,2004
GK聚类算法:
(1)选择聚类数目
、模糊指数棚
,赋模糊划分矩阵
,初值并满足
,迭代次数
,迭代中止条件
;
(2)根据式
更新聚类中心
;
(3)根据式
计算模糊协方差矩阵;
(4)根据式
计算距离范数;
(5)根据式
更新模糊划分矩阵
;
(6)如果
则终止,否则
转到
(2)。
按照以上流程所设计的M函数如下:
[result]=Cyclist(data,march)
[data]=august_formalism(data)
[evil]=clusteval(new,result,march)
程序实例
有一个测试摩托车的数据集存放在Motorcycle.sat中,该数据集为一个82×2的矩阵。
GK模糊聚类工具实现聚类程序如下:
clearall
path(path,'C:
\ProgramFiles\MATLAB\R2009b\toolbox\GKCLUST')
loadMotorcycle.Sat
data=Motorcycle(:
[12]);
march.c=4;
march.m=2;
march.e=1e-6;
march.mon=ones(1,march.c);
data=august-formalism(data);
result=Cyclist(data,march);
plot(data(:
1),data(:
2),'b.',result.V(:
1),result.V(:
2),'ro');
label('caiyangzhi');
label('lishudu');
holdon
new=data;
evil=clusteval(new,result,march);
GK聚类等高线图
通过以上的聚类实例表明了GK模糊聚类算法程序的正确性和有效性。
有了这样快速简捷的聚类工具,这将对扩大GK模糊聚类算法的使用及对于各种各样的仿真研究都有非常实际的意义。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 综述 展望