哈工大人工智能课件chpt6.ppt
- 文档编号:11077638
- 上传时间:2023-05-29
- 格式:PPT
- 页数:104
- 大小:1.75MB
哈工大人工智能课件chpt6.ppt
《哈工大人工智能课件chpt6.ppt》由会员分享,可在线阅读,更多相关《哈工大人工智能课件chpt6.ppt(104页珍藏版)》请在冰点文库上搜索。
人工智能原理第6章知识表示,本章内容6.1知识表示概述6.2本体论6.3产生式系统6.4框架6.5语义网络6.6脚本参考书目,第6章知识表示,3,知识表示的重要性,知识表示是AI的基础,也就是构建智能体的基础知识表示是推理和行动的载体/没有合适的知识表示,任何构建智能体的计划都无法付诸实施表示常常和推理紧密联系知识表示通常是一些符号的集合/推理和行动可以由这些符号构建,也可以本身就代表着一种行为结构(如神经网络),第6章知识表示,6.1知识和知识表示,第6章知识表示,5,知识与知识表示,知识的定义?
Feignebaum:
知识是经过消减、塑造、解释和转换的信息Bernstein:
知识是由特定领域的描述、关系和过程组成的Hayes-roth:
知识是事实、信念和启发式规则知识库的观点:
知识是某领域中所涉及的各有关方面的一种符号表示,第6章知识表示,6,知识与知识表示,知识的种类事实性知识:
采用直接表示的形式如:
凡是猴子都有尾巴过程性知识:
描述做某件事的过程如:
电视维修法行为性知识:
不直接给出事实本身,只给出它在某方面的行为如:
微分方程、(事物的内涵),第6章知识表示,7,知识与知识表示,知识的种类实例性知识:
只给出一些实例,知识藏在实例中类比性知识:
既不给出外延,也不给出内涵,只给出他与其他事物的某些相似之处,例如比喻、谜语元知识:
有关知识。
最重要的元知识是如何使用知识的知识,如何从知识库中找到想要的知识,第6章知识表示,8,知识与知识表示,知识的要素事实:
事物的分类、属性、事物间的关系、科学事实、客观事实等(最底层的知识)规则:
事务的行为、动作和联系的因果关系知识(启发式规则)控制:
当有多个动作同时被激活时,选择哪一个动作来执行的知识(技巧性)元知识:
高层知识。
怎样使用规则、解释规则、校验规则、解释程序结构等知识,第6章知识表示,9,知识与知识表示,知识表示的定义知识表示研究用机器表示知识的可行性、有效性的一般方法。
知识表示是智能推理的部分理论知识表示是有效计算的载体知识表示是交流的媒介(如语义网络),第6章知识表示,10,知识与知识表示,选取知识表示的因素表示范围是否广泛是否适于推理是否适于计算机处理是否有高效的算法能否模块化总之,人工智能问题的求解是以知识表示为基础的。
如何将已获得的有关知识以计算机内部代码形式加以合理地描述、存储、有效地利用,便是知识表示应解决的问题。
第6章知识表示,11,知识与知识表示,知识表示研究特点智能行为的特有的灵活性。
“常识问题”不能概括为一类简洁的理论,使大量小理论的集合AI的任务受到计算装置的约束。
这导致了所采用的“表示”必须同时满足“刻画智能现象”与“计算装置可以接受”,这两个有时是矛盾的条件,第6章知识表示,6.2本体论(Ontology)6.2.1本体论研究内容6.2.2本体论分类6.2.3描述事物与时空6.2.4领域Ontology应用,第6章知识表示,13,本体论与存在,本体论(Ontology)是关于存在(existence)的研究存在是什么所有的实体(entity),包括抽象的和具体的(abstract&concrete),正是它们组成了世界当代定义:
共享概念模型的明确的形式化规范说明/要素:
概念模型明确形式化共享,第6章知识表示,14,Ontology定义的要素,概念模型对现实世界的一些现象抽象出相关概念而得到的模型明确所用概念和所用概念的约束均有明确定义形式化计算机可读的共享体现了共同认可的知识,反映的是相关领域中公认的概念集合,第6章知识表示,15,6.2.1本体论研究内容,本体论是关于事物本身的研究,主要研究如何描述事物(定义),特别是如何分类事物,第6章知识表示,16,基于本体论的分类,基于本体论的分类/对于事物的描述本体论分类(OntologicalCategories)或者称为基于本体论的分类:
是对事物一种尽可能详细完备的分类方式本体论分类可以分为4级:
顶级Ontology最普通的概念及其关系领域Ontology特定领域的概念任务Ontology特定任务或行为中应用Ontology依赖于特定领域和任务,第6章知识表示,17,构造Ontology的规则,构造Ontology的5条标准(Gruber,1995)明确性和客观性用自然语言对所定义术语给出明确、客观的语义定义完全性给出的定义是完整的,完全能表达所定义术语的含义一致性由术语得出的推论与术语本身的含义相容最大单调可扩展性添加通用或专用术语时,不需要修改已有内容最小承诺对待建模的对象给出最少的约束,第6章知识表示,18,6.2.2本体论分类,以美国著名的知识工程CYC(encyclopedia)为例(号称是世界上最大的知识库),介绍其顶层的分类(早期版本)CYC研究最早始于1984年,距今已经20余年(ThedevelopmentofCycwasaverylong-term,high-riskgamblethathasbeguntopayoff.见其主页)CYCKB包括数千个微理论(microtheories),一些微理论面向特定领域,该机制允许各子库独立维护CYCKB已经有20万术语(term),每个术语又包含了几十个论断(assertion),第6章知识表示,19,CYC本体论顶层分类,第6章知识表示,20,CYC本体论的层次结构
(1),最顶层称为Thing/Entity/,下一层为什么是分为三个分支?
最右分支一开始是作为其他两类的补充而出现,后来改进为元层次表示(metalevel),可作为“关于表示的表示”而存在注意:
某些CYC层次和分类仍有争论/也是本体论特色之一,第6章知识表示,21,CYC本体论的层次结构
(2),合乎老子的道家学说:
TheTaogavebirthtotheOne;TheOnegavebirthtotheTwo;TheTwogavebirthtotheThree;AndtheThreegavebirthtothetenthousandthings.,第6章知识表示,22,本体论顶层分类
(1),二分法:
物理(Physical)/抽象(Abstract)三分法:
独立(Independent)/关系(Relative)/中介(Mediating)分别称为第一级(Firstness)/第二级(Secondness)/第三级/(Thirdness)二者结合生成6个类别,第6章知识表示,23,本体论顶层分类
(2),二分法和三分法结合(Peirce&Whitehead)/哲学上的理念,第6章知识表示,24,本体论顶层分类(4),万物的存在形式与时间的关系:
相对静止或变化中于是增加一种属性描述,可以将上述分类再次一分为二相对静止连续相(Continuants)相对变化发生相(Occurrents)从时间角度观察万物,存在着一个视点(Viewpoint):
Minutes尺度冰河(glacier)=Continuants/雪崩(avalanche)=Occurrents/Centuries尺度冰河=Occurrents,第6章知识表示,25,本体论顶层分类(5),第6章知识表示,IndependentRelativeMediating,PhysicalAbstractContinuantOccurrentContinuantOccurrent,组合关系:
Object=IPCetc.,26,6.2.3描述事物与时空,本体论在描述事物与时空时有诸多考虑,这里概要地介绍一点物理实体(physicalentity)与抽象形式(abstract)之间关系:
多对一同一形式可能对应于不同实体,存在歧义,第6章知识表示,左图是:
词汇“TOOT”?
1001上面加一横线?
桌子下面有两个气球?
27,集合与分类,如何描述多个事物?
需要引入集合和分类/相关术语集合(set)具有两种操作的结构(/)/不能描述不可数事物聚集(collection)对事物更简单、更一般的排列/可以描述可数的和不可数的事物类型(type)关于实体聚集的规格(specification)/独立于集合内容的改变分类(category)用于分类的类型,第6章知识表示,28,类型与事物集合,概念“类型(type)”是一个抽象规格,而不是事物的集合对于每个类型t,有集合t称为t的指示(denotation)frog=概念系统的一个类型,frog=世界上所有青蛙的集合在类型格子(lattice)和集合(现实事物)格子之间不存在一一映射如type(麒麟Unicorn)映射为空集/而Human和FeatherlessBiped指的都是人类,第6章知识表示,29,空间与时间,集合论对离散元素和严格界限的要求给连续的空间和时间的表示带来麻烦如空间中由点组成物体,那么中点/中线在哪里?
类似的问题:
关于瞬时(instant)是否组成期间(duration)引入:
没有点的空间(spacewithoutpoints)没有瞬时的时间(timewithoutinstants),第6章知识表示,30,6.2.4领域Ontology应用,生物信息学(bioinformatics)是当前一个学科交叉的研究热点任务之一:
在生物及医学科学文献中识别出生物实体之间的相互关系例如:
蛋白质与蛋白质之间的关系theproteinfrommembranebindsto疾病与治疗手段之间的关系,canpreventmajorischaemiceventswith,第6章知识表示,31,N-N形式的名词复合,在科学文献中,多个名词顺序连接组合成一个名词短语用以表示一个科技术语,这类组合称为名词复合(nouncompounds,NCs)/最简单的是N-N复合生物信息学中的例子abdomenradiographyinjuryrehabilitationdeliriumtreatment,第6章知识表示,32,N-N间关系的确定,很显然,N-N两个名词之间存在一定的关系,如上例中abdomenradiography是身体部位与检查手段之间的关系/识别N-N之间的关系也是一种关系识别有各种方法可以识别N-N之间的关系建立识别规则库,积累识别的例子通过语料库训练,采用统计学习方法进行分类利用专业领域词典,判别N-N各自的类别,从而建立两者之间的关系,第6章知识表示,33,生物医学领域词汇本体库MeSH,MeSH=MedicalSubjectHeadings是美国国家医学图书馆的词库(controlledvocabularythesauruswithhierarchicalstructure/lexicalontology)MeSH有15个主要子分支(sub-hierarchies,trees),对应着医学词汇的主要分支AAnatomyBOrganismsCDiseases每个子分支下还有更多的层次,最多到6层,类似于IP地址一样编号(第1层字母),第6章知识表示,34,N-N类别对,可以认为:
MeSH包含了生物医学领域中的绝大部分专业词汇;那么,N-N的两个名词通过查找MeSH中它们的上位类别不是可以找到两者之间的关系吗?
因此,假定BarbaraRosario,2005:
AllN-Ncanbecharacterizedbyacategorypair(CP),aparticularsemanticrelationshipholdsbetweenthem每个名词的category来自MeSH,第6章知识表示,35,N-N间关系的标注,语料库=1M篇Medlinetitlesandabstracts从中抽取了1MN-N名词复合其中不重复的N-N对共79677个,全部属于MeSHN-N取它们在MeSH之中的类别,构成了类别对,这个类别对就是一种语义关系/但是MeSH中有多个层次,哪个层次的类别确定关系最合适?
手工判定,形成规则/抽取各类的20%进行标注标注原则:
某个层次上的类别所包含的N-N之间都是同一关系,则所属类别接受为一条关系识别规则,第6章知识表示,36,标注算法,ForeachN1-N2,classifythemaccordingtosameC1repeatdescentprocesstillsomelevelsandgetarule,第6章知识表示,37,实例形成的识别规则
(1),都是第1层次:
A01(bodyregion)A07(cardiovascularsystem)scalparteries(头皮动脉)/heelcapillary(踵部毛细血管)/thighvein(大腿静脉)第1层次和第2层次:
A01M01.643(Patients):
ankleinpatient/eyeoutpatientA01M01.898(donors):
eyedonor/skindonor,第6章知识表示,38,实例形成的识别规则
(2),第2层次和第1层次:
J01.637(manufacturedmaterials)A01:
glasseye/neopreneelbow(橡胶肘)规则分布:
250个CPs的一个名词属于Anatomy类,其中187个在第1层次,如A01-A0774%55个降到第2层次,如A01-M01.89822%7个降到第3层次2%其他类E/G/N等,至少50%要降下1层,第6章知识表示,39,实验结果,根据上述规则,随机选择了20%N-N对作为测试集(开放集,完全不同于规则抽取依赖的数据),进行实验/由具有生物医学知识背景的人员独立进行评价如果N-N中名词属于A/H01/C04之一,则得到89.6%的类内平均精确率(如果两个词同属于上述3类)(intra-categoryaveraging)/90.8%跨类平均精确率/似乎还不完整结果分析:
存在一些歧义,需要进一步解决实验结果:
令人满意甚至有点惊奇,第6章知识表示,6.3产生式系统6.3.1产生式系统的组成6.3.2产生式系统的应用,第6章知识表示,41,产生式规则,产生式系统是基于知识的智能体,其基础是各种知识元这些知识元之间存在着大量的因果关系即前提和结论的关系,用产生式或者称为规则的形式来表示是非常方便的大量应用于各类专家系统当中产生式系统=面向应用的逻辑系统,第6章知识表示,42,各种产生式系统,产生式最早由美国数学家Post1943年提出,用于作为一种形式化运算工具60年代,产生式系统成为认知心理学研究人类心理活动中信息加工过程的基础,由此心理学家认为人脑对知识的存储就是产生式形式的。
因此用它来建立人类认知模型。
一些特殊的产生式系统:
谓词公式的蕴涵关系上下文无关文法BNF范式(巴克斯范式),第6章知识表示,43,表示方法产生式规则表示法,表示形式事实的表示:
可看成是断言一个语言变量的值或是多个语言变量间的关系的陈述句实例1:
香蕉是黄色的。
语言变量香蕉,值黄色的实例2:
小李喜欢小莉。
语言变量小李、小莉,关系值喜欢一般使用三元组(对象,属性,值)或(关系,对象1,对象2)来表示事实。
如:
对事实“老李年龄今年是65岁”可表示成:
(Li,Age,65)而“老赵和老张是朋友”可写成:
(Friend,Zhao,Zhang),第6章知识表示,44,6.3.1产生式系统的组成,产生式系统的三要素:
产生式规则集、综合数据库(或者称数据基)和控制系统(或者称解释程序)产生式:
一组产生式规则(规则集)相当于系统的知识库,每条规则分为左部LHS和右部(IFTHEN)/其中规则的表达的是该条规则所要满足的条件,规则的表示的是该规则所得出的结论,或者动作天上下雨地上湿北京是中国的首都,第6章知识表示,45,产生式系统的组成,数据基:
一个数据的集合,用于存放在推理过程中的已知条件、推导出的中间结果和最终结论等控制系统,用于控制系统的运行,它根据综合数据库中的当前数据,来选择合适的规则/不同的选择规则的方法,就构成了不同的控制策略/因此控制系统也可以称之为推理引擎,第6章知识表示,46,产生式系统的推理,正向推理:
数据驱动反向推理:
目标驱动双向推理在与或树表示方法的基础上进行,第6章知识表示,47,与或树,第6章知识表示,48,产生式系统的推理,正向推理:
是从已知事实出发,通过规则库求得结论。
或称为数据驱动方式,也称为自底向上(Bottom-up)。
推理过程:
规则集中的规则与数据库中的事实进行匹配,得到匹配的规则集合从匹配的规则集合中选择一条规则作为使用规则执行使用规则的后件。
将该使用规则的后件输入数据库。
重复进行,直到达到目标规则:
事实中包含“网状叶脉”,根据规则“网状叶脉双子叶纲”,匹配得到“双子叶纲”,则将“双子叶纲”送入数据库中成为新的证据,作为新的前提,可以在随后的推理中使用。
第6章知识表示,49,产生式系统的推理,反向推理:
从目标出发,反向使用规则,求得已知事实,或称为目标驱动方式也称自顶向下(Top-down)推理方式。
推理过程:
用规则集中的规则后件与目标事实进行匹配,得到匹配的规则集合从匹配的规则集合中选择一条规则作为使用规则把执行的使用规则的前件作为下一个循环的目标事实重复进行,直到达到目标,第6章知识表示,50,产生式系统的特点
(1),用产生式系统结构求解问题的过程和人类求解问题的思维很相像,因而可以用来模拟人类求解问题的思维过程可以把产生式系统作为人工智能系统的基本结构单元或者基本模型看待,就好像是积木世界中的积木块一样。
因而研究产生式系统的基本问题就具有一般意义。
表示的格式固定,形式单一,规则间相互独立,所以建立容易;推理方式单纯,知识库与控制系统分离,修改方便,容易理解。
第6章知识表示,51,产生式系统的特点
(2),优点:
模块性规则与规则之间相互独立。
灵活性知识库易于增加,修改,删除自然性方便地表示专家的启发性知识透明性易于保留动作所产生的变化、轨迹,第6章知识表示,52,产生式系统的特点(3),缺点:
知识库维护难效率低理解难,规则之间不能调用,不能表示结构性的知识,第6章知识表示,53,6.3.2产生式系统的应用,产生式系统对某些领域的应用很有效知识从模块性角度可以分为两类:
第一类:
许多独立知识元构成,相互之间关系不密切典型例子:
医生诊断/化学反应第二类:
一个较小的核心推出其余的部分,形成一个统一整体典型例子:
数学产生式系统适于第一类知识而不适用于第二类,第6章知识表示,54,产生式表示举例
(1),猜帽子颜色3个人每人头上1顶帽子(看不到自己头上的帽子),红白两色,至少1顶为白色/看谁抢答正确情况分析:
1顶白色/2顶白色/3顶白色结合眼见情况,作出判断1)1顶白帽看见2顶红帽头上帽子必为白色/立即抢答2)1顶白帽看见1白1红白者抢答/自己不要落后跟着答红色,第6章知识表示,55,产生式表示举例
(2),3)2顶白帽看见1白1红第1次提问白者答不出,则自己抢答为白色4)2顶白帽看见2顶白帽第1遍任一个白者答不出,第2遍某个白者答出/自己应立即抢答为红色5)3顶白帽看见2顶白帽第1遍和第2遍二人都答不出,则应抢答为白色设另外2人分别为A,B,第6章知识表示,56,产生式表示举例(3),写为产生式规则如下:
A=红帽B=红帽自己=白帽A=红帽B=白帽B抢答自己=红帽(A|B的帽色交换,同样结论,是对称的)A=红帽B=白帽B第1次答不出自己=白帽A=白帽B=白帽B第1次答不出B第2次答出自己=红帽A=白帽B=白帽B第1次答不出B第2次答不出自己=白帽,第6章知识表示,57,产生式系统推理中的相关问题,数据基中部分谓词保持不变问题框架问题随时间而变化的情景演算匹配冲突问题解决冲突的策略产生式、数据、目标的排序非确定性匹配不同事实的匹配加权计算引入概率值的不精确推理,第6章知识表示,6.4框架6.4.1框架的表示6.4.2框架系统的功能,第6章知识表示,59,框架与属性列举,对于事物的描述,可以列举事物的属性/知识表示从属性描述开始,如属性表框架是Minsky在1975年提出的一种概念,他从心理学证据出发,认为人的知识以框架结构记存在人脑中用于表示出事物各方面的属性,也可以表示事物之间的类属关系、事物的特征和变异用于识别、分析、预测事物及其行为,第6章知识表示,60,6.4.1框架的表示,框架表示的基本思想:
各类事物的状态、属性、发展过程和相互关系往往有一定规律性,可称为“套子”,总结出来存于知识库;以后再认识新事物时,可以根据新事物初步印象,用类比方法从知识库取出一个最近似的“套子”,进行匹配,可以尽快获得对新事物的全面认识,第6章知识表示,61,框架的表示形式,框架的基本要素“属性-值”对或“槽-值”对/框架由一系列“属性-值”对组成,左图是一个立方体上方斜俯视图其框架主要由面和线组成,第6章知识表示,62,立方体斜俯视图框架,框架名:
立方体斜俯视图物体:
立方体视角:
斜俯视呈现形状:
六角形上面:
面A斜视图(L1,L2,L3,L4)左下面:
面B斜视图(L5,L4,L6,L8)右下面:
面C斜视图(L6,L3,L7,L9)边:
L1,L2,L3,L4,L5,L6,L7,L8,L9姿态:
平卧负载面:
A接地面:
B,C,第6章知识表示,63,面斜视图框架,框架名:
面X斜视图(y1,y2,y3,y4)物体:
矩形面视角:
斜俯视|斜侧俯视呈现形状:
平行四边形左上边:
y1右上边:
y2左下边:
y3右下边:
y4姿态:
平卧|直立负载面:
是|否接地面:
是|否,第6章知识表示,64,框架的主要特征,框架具有以下6条主要特征每个框架有一个框架名(可带参数)每个框架有一组属性,每个属性称一个槽,存放属性值属性有一定的数据类型,不同属性类型不同属性值可以是子框架调用,调用可以带参数有些属性值可以事先确定,有些属性值需要在生成实例时代入属性值在代入时需要满足一定条件,不同属性值之间有时也要满足一定的约束条件,第6章知识表示,65,6.4.2框架系统的功能,一个框架系统应该具备以下10个功能功能1描述设置一组属性/规定每个属性的性质/规定属性之间关系每个属性本身无内部结构/需要时又可调用其它框架则此时变为有内部结构属性可以设置缺省值同一属性的数量可以不确定可以设置可选的属性,第6章知识表示,66,框架系统具备的功能
(2),功能2子类子类定义通过子框架实现通过某个属性把一系列框架联系起来,形成一个层次体系例子:
交通工具框架汽车框架奔驰轿车框架功能3实例子类的最底层是实例,第6章知识表示,67,框架系统具备的功能(3),功能4匹配与产生式不同,框架通常只能与现实做到部分匹配,完全匹配是一个特殊情况/因为框架是对一类事物的完整或典型的描述,而待匹配的具体个体不可能做到完全一致不匹配的情况:
某个属性不存在/与规定的属性值不符/缺省值不符/属性类型不符当存在不匹配时,如何判定是否匹配成功:
规定必要条件/规定允许误差/属性加权/增加判定式,第6章知识表示,68,框架系统具备的功能(4),功能5预测根据框架中的条件和观察值,预测其它框架中的事物例子:
机器人进入房间看到3个煤气罐,根据“煤气罐数量=煤气灶数量”,推断存在3个煤气灶(尽管可能没有发现3个煤气灶)功能6继承下层框架从上层框架继承相关的属性、属性值、条件继承时可以有限制地继承/排斥属性、属性值、条件等,第6章知识表示,69,框架系统具备的功能(5),功能7变异如果发生框架与事物很不一致的情况,导致框架调用的变化对面临的复杂情况,可以引入综合分析功能8更新框架调用的改变功能9修改如果尚不能调用新框架,则修改老框架功能10查找实现过程中运用各种查询策略,第6章知识表示,6.5语义网络6.5.1命题语义网络6.5.2语义网络上的推理6.5.3综合举例,第6章知识表示,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈工大 人工智能 课件 chpt6