第4章-不确定性知识的表示与推理技术.ppt
- 文档编号:12990322
- 上传时间:2023-06-09
- 格式:PPT
- 页数:139
- 大小:1.91MB
第4章-不确定性知识的表示与推理技术.ppt
《第4章-不确定性知识的表示与推理技术.ppt》由会员分享,可在线阅读,更多相关《第4章-不确定性知识的表示与推理技术.ppt(139页珍藏版)》请在冰点文库上搜索。
2023/6/9,1,第4章不确定性知识的表示与推理技术,2023/6/9,2,内容,4.1不确定性知识表示与推理概述4.2确定性理论4.3主观贝叶斯方法4.4证据理论4.5基于贝叶斯网络的推理4.6模糊推理4.7不确定性推理的应用,2023/6/9,3,4.1不确定性知识表示与推理概述,一般的(确定性)推理过程:
运用已有的知识由已知事实推出结论.如已知:
事实A,B知识ABC可以推出结论C。
此时,只要求事实与知识的前件进行匹配。
问题:
如果A可能为真,B比较真,知识ABC只在一定程度上为真,结论如何?
2023/6/9,4,4.1不确定性知识表示与推理概述,通过几个例子认识不确定性:
今天有可能下雨如果乌云密布并且电闪雷鸣,则很可能要下暴雨。
张三是个秃子“秃子悖论”,2023/6/9,5,4.1不确定性知识表示与推理概述,4.1.1不确定性及其类型4.1.2不确定性推理概述,2023/6/9,6,4.1.1不确定性及其类型
(1),不确定性:
知识和信息中含有的不肯定、不可靠、不准确、不精确、不严格、不严密、不完全甚至不一致的成分。
按性质分类:
随机不确定性模糊不确定性不完全性不一致性,2023/6/9,7,4.1.1不确定性及其类型
(2),随机不确定性随机不确定性是基于概率的一种衡量,即已知一个事件发生有多个可能的结果。
虽然在该事件发生之前,无法确定哪个结果会出现,但是,可以预先知道每个结果发生的可能性。
例如:
“这场球赛甲队可能取胜”“如果头疼发烧,则大概是患了感冒。
”2.模糊不确定性模糊不确定性就是一个命题中所出现的某些言词其涵义不够确切,从概念角度讲,就是其代表的概念的内涵没有硬性的标准或条件,其外延没有硬性的边界。
例如:
“小王是高个子。
”“张三和李四是好朋友。
”把涵义不确切的言词所代表的概念称为软概念。
2023/6/9,8,4.1.1不确定性及其类型(3),3.不完全性对某事物了解得不完全或认识不够完整。
如,刑侦过程的某些阶段往往要针对不完全的证据进行推理。
4.不一致性随着时间或空间的推移,得到了前后不相容或不一致的结论。
如,人们对太空的认识等。
2023/6/9,9,4.1.2不确定性推理
(1),1.不确定性推理方法的分类,控制方法,模型方法,非数值方法,数值方法,模糊推理,基于概率,纯概率,可信度方法,证据理论,主观Bayes,通过识别领域内引起不确定性的某些特征及相应的控制策略来限制或减少确定性对系统产生的影响。
贝叶斯网络,2023/6/9,10,4.1.2不确定性推理概述
(2),对比一下不确定性推理与通常的确定性推理的差别:
(1)不确定性推理中规则的前件能否与证据事实匹配成功,不但要求两者的符号模式能够匹配(合一),而且要求证据事实所含的信度必须达“标”,即必须达到一定的限度。
这个限度一般称为“阈值”。
(2)不确定性推理中一个规则的触发,不仅要求其前提能匹配成功,而且前提条件的总信度还必须至少达到阈值。
(3)不确定性推理中所推得的结论是否有效,也取决于其信度是否达到阈值。
(4)不确定性推理还要求有一套关于信度的计算方法,包括“与”关系的信度计算、“或”关系的信度计算、“非”关系的信度计算和推理结果信度的计算等等。
2023/6/9,11,4.1.2不确定性推理概述(3),2.不确定性推理需要解决的问题1)不确定性的表示与度量证据的不确定性规则(知识)的不确定性结论的不确定性2)不确定性的匹配算法3)不确定性的计算与传播组合证据的不确定性计算(最大最小方法、概率方法、有界方法)证据和知识的不确定性的传递不同证据支持同一结论时其不确定性的合成因此,不确定性推理的一般模式也可以简单地表示为:
不确定性推理=符号推演+不确定性计算,2023/6/9,12,4.2确定性理论,4.2.1知识的不确定性表示4.2.2证据的不确定性表示4.2.3不确定性的传播与计算4.2.4确定性理论的特点及进一步发展,2023/6/9,13,4.2.1知识的不确定性表示
(1),不确定性度量知识的不确定性表示:
ifEthenH(CF(H,E)CF(H,E):
是该条知识的可信度,称为可信度因子或规则强度,它指出当前提条件E所对应的证据为真时,它对结论为真的支持程度。
如:
“如果头疼发烧,则患了感冒;(0.8)。
”“如果乌云密布并且电闪雷鸣,则很可能要下暴雨。
(0.9)”,2023/6/9,14,4.2.1知识的不确定性表示
(2),在CF模型中,CF的定义为CF(H,E)=MB(H,E)-MD(H,E)用P(H)表示H的先验概率;P(H/E)表示在前提条件E对应的证据出现的情况下,结论H的条件概率。
MB(MeasureBelief):
称为信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真的信任增长度。
MB定义为:
2023/6/9,15,4.2.1知识的不确定性表示(3),MD(MeasureDisbelief):
称为不信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真的不信任增长度。
MD定义为:
2023/6/9,16,4.2.1知识的不确定性表示(4),由MB、MD得到CF(H,E)的计算公式:
2023/6/9,17,4.2.1知识的不确定性表示(5),CF公式的意义当MB(H,E)0时,MD(H,E)0,表示由于证据E的出现增加了对H的信任程度。
当MD(H,E)0时,MB(H,E)0,表示由于证据E的出现增加对H的不信任程度。
注意:
对于同一个E,不可能既增加对H的信任程度又增加对H的不信任程度。
2023/6/9,18,4.2.1知识的不确定性表示(6),当已知P(H),P(H/E),运用上述公式可以求CF(H/E)。
但是,在实际应用中,P(H)和P(H/E)的值是难以获得的。
因此,CF(H,E)的值要求领域专家直接给出。
其原则是:
若由于相应证据的出现增加结论H为真的可信度,则使CF(H,E)0,证据的出现越是支持H为真,就使CF(H,E)的值越大;反之,使CF(H,E)0,证据的出现越是支持H为假,就使CF(H,E)的值越小;若证据的出现与否与H无关,则使CF(H,E)=0。
2023/6/9,19,4.2.1知识的不确定性表示(7),例如果感染体是血液,且细菌的染色体是革兰氏阴性,且细菌的外形是杆状,且病人有严重发烧,则该细菌的类别是假单细胞菌属(0.4)。
这就是专家系统MYCIN中的一条规则。
这里的0.4就是规则结论的CF值。
2023/6/9,20,4.2.2证据的不确定性表示
(1),证据的不确定性表示初始证据CF(E)由用户给出先前推出的结论作为推理的证据,其可信度由推出该结论时通过不确定性传递算法而来。
2023/6/9,21,4.2.3不确定性的传播与计算
(1),组合证据前提证据事实总CF值计算(最大最小法)E=E1E2EnCF(E)=minCF(E1),CF(E2),CF(En)E=E1E2EnCF(E)=maxCF(E1),CF(E2),CF(En)E=E1CF(E)=-CF(E1),2023/6/9,22,4.2.3不确定性的传播与计算
(2),推理结论的CF值计算C-F模型中的不确定性推理是从不确定的初始证据出发,通过运用相关的不确定性知识,最终推出结论并求出结论的可信度值。
结论H的可信度由下式计算:
CF(H)=CF(H,E)max0,CF(E),当CF(E)0时,CF(H)=0,说明该模型中没有考虑证据为假时对结论H所产生的影响。
2023/6/9,23,4.2.3不确定性的传播与计算(3),重复结论CF值计算ifE1thenH(CF(H,E1)ifE2thenH(CF(H,E2)
(1)计算CF1(H)CF2(H);
(2)计算CF(H):
CF1(H)+CF2(H)CF1(H)CF2(H)若CF1(H)0,CF2(H)0CF1(H)+CF2(H)+CF1(H)CF2(H)若CF1(H)0,CF2(H)0CF1(H)+CF2(H)若CF1(H)与CF2(H)异号,CF1,2(H)=,2023/6/9,24,4.2.3不确定性的传播与计算(4),例4.1设有如下规则:
r1:
IFE1THENH0.8)r2:
IFE2THENH(0.9)r3:
IFE3ANDE4THENE1(0.7)r4:
IFE5ORE6THENE1(0.3)并已知初始证据的可信度为:
CF(E2)=0.8,CF(E3)=0.9,CF(E4)=0.7,CF(E5)=0.1,CF(E6)=0.5,用确定性理论计算CF(H)。
2023/6/9,25,4.2.3不确定性的传播与计算(5),由r3可得:
CF1(E1)=0.7min0.9,0.7=0.49由r4可得:
CF2(E1)=0.3max0.1,0.5=0.15从而CF1,2(E1)=(0.490.15)/(1min(|0.49|,|0.15|)=0.34/0.85=0.4由r1可得:
CF1(H)=0.40.8=0.32由r2可得:
CF2(H)=0.80.9=0.72从而CF1,2(H)=0.32+0.72-0.320.72=0.8096这就是最终求得的H的可信度。
2023/6/9,26,4.2.4确定性理论的特点及进一步发展,可信度方法的进一步发展
(1)带有阈值限度的不确定性推理知识表示为:
ifEthenH(CF(H,E),)其中是阈值,它对相应知识的可应用性规定了一个度:
01
(2)加权的不确定性推理知识表示为:
ifE1
(1)andE2
(2)andthenH(CF(H,E),)其中1,1,n为加权因子。
(3)前提条件中带有可信度因子的不确定性推理知识表示为:
ifE1(cf1)andE2(cf2)andthenH(CF(H,E),),2023/6/9,27,4.3主观贝叶斯方法
(1),简介主观贝叶斯方法是R.O.Duda等人1976年提出的一种不确定性推理模型,并成功地应用于地质勘探专家系统PROSPECTOR。
其核心思想是:
根据:
.证据的不确定性(概率)P(E);.规则的不确定性(LS,LN);LS:
E的出现对H的支持程度,LN:
E的出现对H的不支持程度。
把结论H的先验概率更新为后验概率P(H|E);,2023/6/9,28,4.3主观贝叶斯方法
(2),4.3.1知识的不确定性表示4.3.2证据的不确定性表示4.3.3不确定性的传播与计算4.3.4主观贝叶斯方法的特点,2023/6/9,29,4.3.1知识的不确定性表示
(1),知识是用规则表示的,具体形式为:
ifEthen(LS,LN)H(P(H)或:
其中E是该条知识的前提条件,它既可以是一个简单条件,也可以是用and、or把多个条件连接起来的复条件。
H是结论,P(H)是H的先验概率,它指出在没有任何专门证据的情况下,结论为真的概率,其值由领域专家根据以往的实践及经验给出。
2023/6/9,30,4.3.1知识的不确定性表示
(2),LS称为充分性量度,用于指出E对H的支持程度,取值范围为0,),其定义为:
LS=LS的值由领域专家给出,具体情况在下面论述。
LN称为必要性量度,用于指出E对H的支持程度,取值范围为0,),其定义为:
LN=LN的值也由领域专家给出,具体情况在下面论述。
LS,LN相当于知识的静态强度。
2023/6/9,31,在贝叶斯方法中,引入几率函数o(x),它与概率的关系为:
几率函数与概率函数有相同的单调性,但取值为0,下面讨论LS、LN定义的由来,4.3.1知识的不确定性表示(3),2023/6/9,32,4.3.1知识的不确定性表示(4),1)对于LS:
由Bayes公式得:
P(H/E)=P(E/H)P(H)/P(E)同理有:
P(H/E)=P(E/H)P(H)/P(E)除以,得:
P(H/E)P(E/H)P(H)P(H/E)P(E/H)P(H),=,O(H),O(H/E),2023/6/9,33,4.3.1知识的不确定性表示(5),使用几率函数,式可以表示为:
O(H/E)=LSO(H)可以看出,LS越大,O(H/E)越大,则P(H/E)越大,表明E对H为真的支持越强。
当LS,P(H/E)1,E的存在对H为真是充分的,故称LS为充分性量度。
对于上式,证据E肯定存在时,即P(E)=P(E/S)=1,考虑P(H/E)。
由式及“非”运算:
P(H/E)=1P(H/E)、P(H)=1P(H),得:
LS将H的先验概率更新为后验概率,2023/6/9,34,4.3.1知识的不确定性表示(6),2)对于LN:
由Bayes公式得:
P(H/E)=P(E/H)P(H)/P(E)同理有:
P(H/E)=P(E/H)P(H)/P(E)除以,得:
P(H/E)P(E/H)P(H)P(H/E)P(E/H)P(H),O(H),O(H/E),2023/6/9,35,4.3.1知识的不确定性表示(7),LN的定义还可以表示为:
O(H/E)=LNO(H)则LN越大,表明E对H为真的支持越强。
当LN=0,P(H/E)=0,E的不存在导致H为假,说明E对H是必要的,故称LN为必要性量度。
由式及“非”运算P(H/E)=1P(H/E)、P(H)=1P(H),得:
LN将H的先验概率更新为后验概率,2023/6/9,36,4.3.1知识的不确定性表示(9),可以证明:
LS、LN0,它们是不独立的,且有如下约束关系:
当LS1时,LN1;当LS=1时,LN=1;实际系统中,LS、LN值是有专家给出的。
2023/6/9,37,4.3.2证据的不确定性表示
(1),证据的不确定性也是用概率表示的。
对于初始证据E,由用户根据观察S给出P(E/S),它相当于动态强度。
具体应用中采用变通的方法,在PROSPECTOR中引进了可信度的概念,用C(E/S)刻画证据的不确定性。
让用户在5至5之间的11个整数中选一个数作为初始证据的可信度C(E/S)。
初始可信度C(E/S)与概率P(E/S)的对应关系如下:
C(E/S)=-5,表示在观察S下证据E肯定不存在,即P(E/S)=0;C(E/S)=0,表示S与E无关,即P(E/S)=P(E);C(E/S)=+5,表示在观察S下证据E肯定存在,即P(E/S)=1;,2023/6/9,38,4.3.2证据的不确定性表示
(2),C(E/S)=其它数值时,与P(E/S)的对应关系可通过对上述三点进行分段线性插值得到,如下图。
由上图可得到C(E/S)与P(E/S)的关系式,即由C(E/S)计算P(E/S):
2023/6/9,39,4.3.3不确定性的传播与计算,在主观Bayes方法的知识表示中,P(H)是专家对结论H给出的先验概率,它是在没有考虑任何证据的情况下根据经验给出的。
随着新证据的获得,对H的信任程度应该有所改变。
主观Bayes方法推理的任务就是根据证据E的概率P(E)及LS,LN的值,把H的先验概率P(H)更新为后验概率P(H/E)或P(H/E)。
即:
P(H)P(H/E)或P(H/E),2023/6/9,40,4.3.3不确定性的传播与计算
(1),在现实中,证据肯定存在或肯定不存在的极端情况是不多的,更多的是介于两者之间的不确定情况。
现在要在0P(E/S)1的情况下确定H的后验概率P(H/S)。
在证据不确定的情况下,不能再用上面的公式计算后验概率,而需使用R.O.Doda等人1976年证明的如下公式:
P(H/S)=P(H/E)P(E/S)+P(H/E)P(E/S),2023/6/9,41,4.3.3不确定性的传播与计算
(2),下面分四种情况讨论:
1)P(E/S)=1当P(E/S)=1时,P(E/S)=0,此时公式变为:
P(H/S)=P(H/E)=这是证据肯定存在的情况。
2)P(E/S)=0当P(E/S)=0时,P(E/S)=1,此时公式变为:
P(H/S)=P(H/E)=这是证据肯定不存在的情况。
2023/6/9,42,4.3.3不确定性的传播与计算(3),3)P(E/S)=P(E)当P(E/S)=P(E)时,此时公式变为:
P(H/S)=P(H/E)P(E)+P(H/E)P(E)=P(H)表示H与S无关。
4)当P(E/S)=其它值时,通过分段线性插值可得到计算P(H/S)的公式。
全概率公式,2023/6/9,43,4.3.3不确定性的传播与计算(4),该公式称为EH公式。
2023/6/9,44,4.3.3不确定性的传播与计算(5),由前面可知P(E/S)、P(H/S)的计算公式分别为:
2023/6/9,45,4.3.3不确定性的传播与计算(6),对初始证据,用可信度C(E/S)计算P(H/S)对于初始证据,由于其不确定性是用可信度C(E/S)给出的,此时只要把C(E/S)与P(E/S)的对应关系带入上式,便可得到下述公式:
该公式称为CP公式。
2023/6/9,46,4.3.3不确定性的传播与计算(7),相同结论的后验概率合成:
若有n条知识都支持相同的结论H,而且每条知识的前提条件所对应的证据Ei(i=1,2,n)都有相应的观察Si与之对应,此时只要先求出每条知识的O(H/Si),然后运用下述公式求出O(H/S1,S2,Sn)。
最后,再利用P(H/S1,S2,Sn)与O(H/S1,S2,Sn)的关系:
P(H/S1,S2,Sn)=O(H/S1,S2,Sn)/(1+O(H/S1,S2,Sn)计算P(H/S1,S2,Sn)。
2023/6/9,47,4.3.3不确定性的传播与计算(8),例4.2设有如下规则:
r1:
IFE1THEN(65,0.01)H1r2:
IFE2THEN(300,0.001)H1r3:
IFH1THEN(200,0.002)H2已知:
P(E1)=0.1,P(E2)=0.03,P(H1)=0.1,P(H2)=0.05,用户提供证据:
C(E1/S1)=2,C(E2/S2)=1,计算P(H2/S1,S2)。
2023/6/9,48,4.3.3不确定性的传播与计算(9),分析:
自下而上计算:
根据LS值,将H的先验概率转换为后验概率,计算P(H1/E1)、P(H1/E2)使用CP公式计算P(H1/S2)、P(H1/S2),计算O(H1/S1)、O(H1/S2)对H1合成。
计算O(H1/S1,S2)、P(H1/S1,S2)。
根据LS值,将H的先验概率转换为后验概率,计算P(H2/H1)使用EH公式计算P(H2/S1,S2),
(1)计算P(H1/E1)、P(H1/S1)和O(H1/S2),2023/6/9,49,4.3.3不确定性的传播与计算(10),对于初始证据,使用CP公式:
C(E1/S1)=20使用CP公式的后半部。
2023/6/9,50,4.3.3不确定性的传播与计算(11),
(2)计算P(H1/E2)、P(H1/S2)、(O(H1/S2),对于初始证据,使用CP公式,C(E2/S2)=10使用CP公式的后半部。
2023/6/9,51,4.3.3不确定性的传播与计算(12),(3)计算P(H1/S1,S2)、O(H1/S1,S2),2023/6/9,52,4.3.3不确定性的传播与计算(13),(4)计算P(H2/S1,S2)(O(H2/S1,S2),使用EH公式P(H1/S1,S2)P(H1)使用EH公式的后半部。
H2的先验概率为0.05,而最后算出的后验概率为0.6291,2023/6/9,53,4.3.4主观贝叶斯方法的特点,主要优点:
其计算公式大多是在概率论的基础上推导出来的,具有较坚实理论基础;知识的静态强度LS、LN由领域专家根据实际经验得到,避免了大量的数据统计工作;给出了在证据不确定情况下更新先验概率为后验概率的方法,且从推理过程中看,确实是实现了不确定性的传递.主要缺点:
它要求领域专家在给出知识时,同时给出H的先验概率,这是比较困难的。
Bayes定理中要求事件间相互独立,限制了该方法的应用。
2023/6/9,54,4.4证据理论
(1),20世纪60年代Dempster把证据的信任函数与概率的上下值相联系,从而提供了一个构造不确定性推理模型的一般框架。
20世纪70年代中期,Shafer对Dempster的理论进行了扩充,在此基础上形成了处理不确定信息的证据理论,出版了证据的数学理论。
证据理论又称Dempster-Shafer理论(D-S理论)或信任函数理论。
是经典概率论的一种扩充形式。
证据理论能充分区分“不确定”和“不知道”的差异,并能处理由“不知道”引起的“不确定”性,具有较大的灵活性。
2023/6/9,55,4.4证据理论
(2),4.4.1D-S理论4.4.2证据理论的不确定推理模型,2023/6/9,56,4.4.1D-S理论
(1),识别框架或论域U1=客机,轰炸机,战斗机U2=红,绿,蓝,橙,黄U3=谷仓,草,人,牛,车,正确答案:
1=轰炸机,战斗机,识别框架的子集就构成了求解问题的各种解答。
将一个不变的、元素两两互斥的完备集合U称为识别框架或论域。
哪些是军用飞机?
(对应识别框架U1),哪些是民用飞机?
(对应识别框架U1),正确答案:
2=客机,2023/6/9,57,4.4.1D-S理论
(2),每一个子集都可以看做是一个隐含的命题。
证据理论就是通过定义在这些子集(命题)上的几种信任函数来计算识别框架中诸子集(命题)为真的可信度,U=感冒,支气管炎,鼻炎,可能是感冒、支气管炎、鼻炎、感冒,支气管炎、感冒,鼻炎、支气管炎,鼻炎、感冒,支气管炎,鼻炎、其中之一。
考察某人得了什么疾病时,如何处理?
2023/6/9,58,4.4.1D-S理论(4),1.基本概率分配函数2.信任函数(下限函数)3.似真函数(上限函数)4.信任区间5.德普斯特组合规则,2023/6/9,59,1.基本概率分配函数
(1),定义4.1给定识别框架U,A2U,称m(A):
2U0,1是2U上的一个基本概率分配函数(FunctionofBasicProbabilityAssignment),若它满足,基本概率分配函数的物理意义:
1.若A属于U,且不等于U,表示对子集命题A的精确信任度2.若A等于U,表示这个数不知如何分配,2023/6/9,60,1.基本概率分配函数
(2),例4.3U1=客机,轰炸机,战斗机,分别用A,B,F代表客机、轰炸机和战斗机,其基本概率分配函数为:
m(A)0.4m(A,B)0m(A,)0.2m(A,B,F)0.2m(B)0m(B,F)0.2m(F)0m()0,基本概率分配函数值由主观给出,一般是某种信度。
所以概率分配函数也被称为信任度分配函数。
m(A)m(B)m(F)0.41可以看出,基本概率分配函数之值并非概率。
2023/6/9,61,2.信任函数,定义4.2:
信任函数(下限函数)给定识别框架U,对于2U中的任意A称为2u上的信任函数(FunctionofBelief)。
信任函数表示对A为真的信任程度,即为包含于A中的所有集合的基本概率分配函数值之和。
性质:
Bel()=0,Bel(U)=1,且对于2U中的任意元素A,有0Bel(A)1。
根据定义:
Bel()=?
Bel(U)=?
例:
考试成绩估分下限问题:
做对的题目分数之和,2023/6/9,62,3似真函数(上限函数),定义4.3似真函数A为2U中的元素,A为A的补集Pl(A)=1-Bel(A)=称为A的似真函数(Plausiblefunction),函数值又称似真度。
似真函数表示对A非假的信任程度,物理意义为与A交集不为空的所有集合的概率分配函数之和。
例,考试成绩估分上限问题
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不确定性 知识 表示 推理 技术