基于最优权重的多源证据加权平均合成算法研究.pdf
- 文档编号:3433719
- 上传时间:2023-05-05
- 格式:PDF
- 页数:4
- 大小:423.53KB
基于最优权重的多源证据加权平均合成算法研究.pdf
《基于最优权重的多源证据加权平均合成算法研究.pdf》由会员分享,可在线阅读,更多相关《基于最优权重的多源证据加权平均合成算法研究.pdf(4页珍藏版)》请在冰点文库上搜索。
统计与决策2011年第10期(总第334期)基金项目:
昆明理工大学组织行为与复杂行为决策创新团队支持计划资助课题(2009007)作者简介:
于东平(1985-),女,江西九江人,博士研究生,研究方向:
DS证据理论及人力资源管理。
段万春(1956-),男,云南大理人,教授,博士生导师,研究方向:
组织行为与决策行为。
孙永河(1978-),男,山西大同人,博士,讲师,研究方向:
复杂系统管理决策。
于东平,段万春,孙永河(昆明理工大学管理与经济学院,昆明650093)摘要:
为克服传统DS合成公式对各证据信息源提供证据平等对待,即在合成时不考虑专家个人差异,无视各信息源提供证据的重要性与可靠性差别这一缺陷,文章通过构建各证据与所有证据之间距离最小化的目标优化模型确定最优权重,并引入平均算法,给出了基于最优权重的多源证据加权平均合成算法。
基于数值试验的对比分析结果表明,新方法在抗干扰及收敛性方面比现有DS合成公式更为优越。
关键词:
DS证据理论;证据权重;加权平均算法;证据距离中图分类号:
O21;TP274文献标识码:
A文章编号:
1002-6487(2011)10-0016-04基于最优权重的多源证据加权平均合成算法研究0引言现实问题中都包含了某种程度的不确定性因素,而处理不确定性信息将涉及很多理论和技术。
对不确定问题的处理,证据理论(Dempster-Shafer理论)已显示出很好的前景1。
但是,证据推理的基本公式,即DS合成公式对于某些常识推理的合成结果却与现实相悖2。
为解决这一问题,很多学者分别从不同的角度对证据理论进行了改进和完善。
综合诸多的改进方法,基本上可以分为对证据组合公式和对证据源本身改进两种类型3。
针对DS合成公式对各证据信息源提供证据平等对待,即在合成时不考虑专家个人差异,无视各信息源提供证据的重要性与可靠性差别这一缺陷,已产生了一些新的思路和方法4。
一种思路是根据已建立的学习样本,通过神经网络、遗传算法等软方法进行优化从而确定证据权重5。
另一种思路是利用专家对评价对象的评价向量与某标杆向量的相似度来分配专家权重68。
为克服两种思路分别对证据权重确定(即通过假设取值)以及对标杆向量选取的随意性的缺陷,本文拟通过构建各证据与其他所有证据之间距离最小化的目标优化模型确定最优权重,并将其引入平均算法,形成了基于最优权重的多源证据加成平均合成算法;并通过数值试验,验证所提方法的优越性。
1DS证据理论及其悖论DS证据理论最早由Dempster于1967年提出9,后由他的学生Shafer于1976年进行了改进10。
由于DS证据理论在处理不确定性及多源证据融合方面的优势,因此一经提出便在人工智能、目标识别等众多领域得到了广泛应用。
定义1在证据理论中,定义一个样本空间,它是由n个两两相斥的命题Ai组成的一个识别框架,即=A1,A2,An。
所有的这些命题组成了系统所要辨识的全部要素。
定义2设为一论域集合,2为所有子集构成的集合,称m:
20,1为基本概率分配函数,且满足下列条件m()=0
(1)A奂m(A)=1
(2)定义3设m1,m2,mn是识别框架上的基本概率分配函数,它们的正交之和m=m1茌m2茌mn为m()=0m(A)=11-KAi=A1jnmj(Ai),A(3)式中:
K=Ai=A1jnmj(Ai)式(3)是DS证据理论的核心,它满足交换律和结合律。
其中,对空集的基本概率指派为0,K称为冲突权值,反映了同一辨识框架下各个证据之间的冲突程度。
通常情况下,DS证据理论都可以得到较好的融合结果。
但当冲突较高,即K1时,运用其组合规则所得到的合成结果有悖常理,出现失效的现象,下例说明了这一情况。
例1辨识框架=A1,A2,A3,有如下两个证据基本概率分配函数:
m1:
m1(A1)=0.99,m1(A2)=0.01m2:
m2(A2)=0.01,m2(A3)=0.99根据式(3)可以计算出,K=0.99,m(A1)=m(A3)=0,m(A2)=1,理论新探16统计与决策2011年第10期(总第334期)这一结果很明显是不合理的。
为解决这个问题,有关学者分别从证据组合公式、证据源本身等不同角度对证据理论进行了改进与完善18。
2现有的信息源权重确定方法针对DS合成公式对各证据信息源提供证据平等对待,即在合成时不考虑专家个人差异,无视各信息源提供证据的重要性与可靠性差别这一缺陷,已产生了一些新的思路和方法。
一种思路是根据已建立的学习样本,通过考察以往各专家在类似判断中的正确率来确定其权威。
具体可通过神经网络、遗传算法等软方法进行优化,比较适用于可重复系统的证据合成5。
如文献1中假设专家1和专家2在类似判断中的正确率分别为1=0.8,2=0.7,据此对其原始概率分配(具体见例1)进行修正,修正方法如下。
设专家1修正后的概率为m1(A),m1(B)和m1(C),令m1(A)=x1,m1(B)=x2,m1(C)=x3,其中x1,x2和x3满足:
x1=0.990.8x1+x2+x3=1x2=x3+0.0?
1(4)专家2修正后的概率为m2(A),m2和m2,令m2(A)=y1,m2(B)=y2,m2(C)=y3,其中y1,y2和y3满足:
y3=0.990.7y1+y2+y3=1y2=y1+0.0?
1(5)根据式(4)和式(5)可以得到经过专家权重修正后的概率为:
m1(A)=0.7920,m1(B)=0.1090,m1(C)=0.0990m2(A)=0.1485,m2(B)=0.1585,m2(C)=0.6930从而使冲突值K降至0.7961,消除了传统的DS证据合成公式在处理例1类型极端冲突证据时的悖论问题。
类似于这种证据权重确定思路的还有文献4、文献11等,即通过事先假定各证据源的权重来考虑证据源的差异问题。
本文认为这种处理方式过于随意(即通过假设取值),且使用条件较为苛刻(即必须具备完备的学习样本)。
与其说它是确定专家权威的一种方法,倒不如说是在专家权威已知条件下的调整过程。
第二种思路是根据专家给出的基本概率分配函数,计算其评价向量与某标杆向量(如均值向量3,合成后证据评价向量7,其他各专家评价向量68)的相似度,并据此确定各位专家的权重。
如文献7构建了基于证据自冲突和证据间距离最小的证据合成方法(即最小冲突合成方法),并利用式(6)的条件机制问题来确定权重因子。
minf=min(|mL-m1|+|mL-m2|+|mL-mn|+BC=mL(B)mL(C)s.t.A哿w(A,m)=1,w(A,m)0,A哿(6)其中:
mL(A)=m(A)+w(A,m)m(),坌A哿文献8通过定义证据距离矩阵、单个证据到证据集的均方欧式距离以及证据可信度因子等概念,得到各证据的可信度因子i,并据此对原始证据按式(7)进行修正,最后运用DS合成公式进行组合。
mi(Aj)=mi(Aj)i(Aj)mi()=1-nj=1mi(Aj)i(Aj?
)(7)综上所述,相对于第一种方法而言,第二种方法通过计算证据的相似性来处理证据源权重问题,操作较为科学,且不需具备完备的学习样本。
故本文认为第二种方法更适合于确定专家权重。
经分析发现,这种思路的关键在于如何选取适当的证据距离公式,以科学地衡量某证据被其他证据的支持力度。
现有的衡量证据之间距离的方法主要有欧式距离、马氏距离、余弦距离等。
由于上述方法未考虑证据内基本概率分配函数包含信息的多少(即未考虑“势”的大小对信息提取的影响),因此仅适用于处理势为1的焦元间的情况,对势不为1的焦元mass函数则无法处理。
基于此,Jousselme等人12提出了处理此类mass函数的距离算法(将在后文予以详细介绍,此处不予重复)。
本文选择此方法作为各证据源之间距离的基础公式,并运用目标优化模型确定各证据源的最优权重。
此外,Murphy13通过对比Smets合成规则、Yager整合规则以及平均算法等证据合成规则,证明了平均算法是目前最为有效的处理证据悖论的方法。
基于此,本文提出基于最优权重的多源证据加权平均合成算法,并将通过实例证明此方法在抗干扰及收敛性方面的优越性。
3基于最优权重的多源证据加权平均合成方法步骤1运用证据源权重,对原始证据mass函数进行修正,如式(8)所示。
mi=wimi(i=1,2,n)(8)其中,wi(i=1,2,n)分别为证据m1,m2,mn在信息融合中的证据权重;mi为原始证据的mass函数;mi为修正后的mass函数。
步骤2构建基于修正后的各证据之间的距离矩阵。
设m1和m2分别为同一识别框架下的基于证据权重修正后的基本概率分配函数,则m1和m2之间的距离可用式(9)12进行表示。
dBPA(m1,m2)=12(m軖1-m軖2)TD(m軖1-m軖2)姨(9)其中,m軖1和m軖2表示修正后的基本可概率分配向量,D为一个2N2N的矩阵,矩阵中的元素为D(A,B)=|AB|AB|(A,BP()dBPA的具体函数表达式可用如式(10)表示:
理论新探17统计与决策2011年第10期(总第334期)证据体D-S证据规则Yayer组合规则Murphy平均法文献3最优权重法文献14加权平均法本文方法m1,m2m(A)=0.0000m(B)=0.8571m(C)=0.1429m(A)=0.0000m(B)=0.1800m(C)=0.0300m()=0.7900m(A)=0.1543m(B)=0.7469m(C)=0.0988m(A)=0.2809m(B)=0.5756m(C)=0.1434m(A)=0.1543m(B)=0.7469m(C)=0.0988m(A)=0.4183m(B)=0.3973m(C)=0.1844m1,m2,m3m(A)=0.0000m(B)=0.6316m(C)=0.3684m(A)=0.0000m(B)=0.0180m(C)=0.0105m()=0.9715m(A)=0.3504m(B)=0.5231m(C)=0.1265m(A)=0.4781m(B)=0.3699m(C)=0.1520m(A)=0.4626m(B)=0.3845m(C)=0.1529m(A)=0.6616m(B)=0.1555m(C)=0.1829m1,m2,m3,m4m(A)=0.0000m(B)=0.3288m(C)=0.6712m(A)=0.0000m(B)=0.0018m(C)=0.0037m()=0.9945m(A)=0.6027m(B)=0.2627m(C)=0.1346m(A)=0.6871m(B)=0.1749m(C)=0.1380m(A)=0.7419m(B)=0.1120m(C)=0.1461m(A)=0.8137m(B)=0.0439m(C)=0.1424m1,m2,m3,m4,m5m(A)=0.0000m(B)=0.1228m(C)=0.8772m(A)=0.0000m(B)=0.0002m(C)=0.0013m()=0.9985m(A)=0.7958m(B)=0.0932m(C)=0.1110m(A)=0.8245m(B)=0.0698m(C)=0.1057m(A)=0.8827m(B)=0.0142m(C)=0.1031m(A)=0.8907m(B)=0.0104m(C)=0.0989表1不同合成方法所得的最终合成结果理论新探dBPA(m1,m2)=12(|m軖1|2+|m軖2|2-2m軖1,m軖2)姨(10)其中:
|m軖|2=m軖,m軖m軖1,m軖2=2Ni=12Nj=1m1(Ai)m2(Aj)|AiBj|AiBj|运用公式(10)可以构建n个证据的距离矩阵(DistacneMeasureMatrix,DMM),从而可以看出两两证据之间的非相似性。
为方便起见,将dBPA(mi,mj)简记为di,j,其中i,j=1,2,n。
DMM=0d1,2d1,n-1d1,nd2,10d2,n-1d2,ndn-1,1dn-1,20dn-1,ndn-1dn-2dn,n-10步骤3构建各证据与其他所有证据之间距离最小化的目标优化模型,从而求解出证据源的最优权重wi*。
为使修正后各证据之间的冲突最小,即各证据与其他所有证据之间的距离最小,本文运用优化理论构建了如式(11)所示的目标优化模型。
MindBPA=mnni=1nj=1di,js.t.w1+w2+wn=1,wi0(11)使用拉格朗日乘子,将其转换为无约束优化问题,目标函数变为凸二次优化问题:
f=ni=1nj=1di,j+(w1+w2+wn-1)(12)其中,为拉格朗日乘子,问题转化为确定w1+w2+wn,使f最小。
步骤4计算各证据修正后的加权平均mass函数(具体见式(13),并运用DS证据规则进行n-1次合成,最终得到合成结果。
m(A)=ni=1wi*mi(A)(13)4数值试验假设某目标识别系统存在5个传感器,待识别的目标分别为A,B,C,由5个传感器所获得的证据分别为:
m1:
m1(A)=0.5,m1(B)=0.2,m1(C)=0.3m2:
m2(A)=0,m2(B)=0.9,m2(C)=0.1m3:
m3(A)=0.55,m3(B)=0.1,m3(C)=0.35m4:
m4(A)=0.55,m4(B)=0.1,m4(C)=0.35m5:
m5(A)=0.55,m5(B)=0.1,m5(C)=0.35为验证本文方法的优越性,现运用不同合成公式对上述5个证据进行合成,具体结果见表1。
从表1中的数据可以看出,传统的DS证据规则及Yager组合规则无法剔除干扰证据源(即m2)对合成结果的影响,从而与预期结果相悖。
尽管Murphy平均算法有效解决了悖论问题,但却未考虑不同证据源信息的可靠性。
虽然文献3和文献14均考虑了证据权重问题,并得出了令人满意的合成结果,但从图13可以看出,本文所提出的基于最优权重的多源证据加权平均合成算法在抗干扰性和收敛性方面均表现出明显的优势。
为进一步比较文献3、文献14和本文所提方法的有效性,分别计算基于以上三种方法所求证据权重下的证据之间的距离,具体见表2。
比较表2中的相关数据可知,基于本文方法所求证据权重下的mi到各证据的距离之和明显小于基于文献3和文献14的结果(除文献3中m1对各证据的距离之和外),从而进18统计与决策2011年第10期(总第334期)调整后的mim1m2m3m4m5文献3方法0.0312520.1312730.0375290.0420660.030165文献14方法0.0330620.1520890.0408780.0408780.040878本文方法0.0319840.0891370.0230290.0230290.023029表2基于三种方法所求证据权重下的各证据之间的距离理论新探一步验证了本文方法的优越性。
5结论传统DS合成公式在处理多源证据信息时存在不考虑专家个人差异,无视各信息源提供证据的重要性与可靠性差别这一缺陷。
为了克服上述缺陷,已出现了一些新思路和新方法。
本文通过构建各证据与其他所有证据之间距离最小化的目标优化模型确定最优权重,并将其引入平均算法,给出基于最优权重的多源证据加成平均合成算法。
新方法在利用证据权重对原始证据进行修正的基础上,引入证据距离计算公式,构建各证据与其他所有证据之间距离最小化的目标优化模型,从而更为客观地反映了不同证据信息源之间的差异性。
另外,利用公式将最优权重引入平均算法中,最终形成了基于最优权重的多源证据加权合成算法。
基于数值试验的对比分析结果表明,新方法在抗干扰及收敛性方面比现有DS合成公式更为优越。
当然,与其他新方法一样,本文所提出的合成方法还需在今后的实际运用中对其优越性予以进一步检验。
参考文献:
1梁昌勇,陈增明,黄永青等.Dempster-Shafer合成法则悖论的一种消除方法J.系统工程理论与实践,2005,27(3).2张所地,王拉娣.Dempster-Shafer合成法则的悖论J.系统工程理论与实践,1997,17(5).3王小艺,刘载文,侯朝桢等.一种基于最优权重分配的DS改进算法J.系统工程理论与实践,2006,28(11).4杨善林,李永森,马溪骏等.基于技术进步和信息不对称的证据合成研究J.系统工程学报,2007,22(3).5杨善林,朱卫东,任明伦.基于可变参数优化的相关证据合成方法研究J.管理科学学报,2003,6(5).6李敏花,戴汝为,李耀东.一种基于即时发言评价的专家权威度计算方法J.模式识别与人工智能,2008,21(4).7李建军,吴根秀,张冬梅.一种新的冲突证据合成方法J.江西师范大学学报(自然科学版),2007,31
(2).8张盛刚,李巍华,丁康.基于证据可信度的证据合成新方法J.控制理论与应用,2009,26(7).9DempsterAP.UpperandLowProbabilitiesInducedbyaMul-ti-valuedMappingJ.AnnalsofMathematicalStatistics,1967,38(4).10ShaferGA.MathematicalTheoryofEvidenceM.Princeton:
PrincetonUniversityPress,1976.11叶青,吴晓平,宋业新.引入权重因子的证据合成方法J.火力与指挥控制,2007,32(6).12JousselmeAL,GrenierD,BosseE.ANewDistancebetweenTwoBodiesofEvidenceJ.InformationFusion,2001,2
(2).13MurphyCK.CombiningBeliefFunctionswhenEvidenceCon-flictsJ.DecisionSupportSystems,2000,29
(1).14ChenLiangzhou,ShiWenkang,DengYong,etal.ANewFusionApproachBasedonDistanceofEvidencesJ.JournalofZhejiangUniversity,2005,6(5).(责任编辑/亦民)19
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 最优 权重 证据 加权 平均 合成 算法 研究