数学建模.docx
- 文档编号:4133085
- 上传时间:2023-05-06
- 格式:DOCX
- 页数:13
- 大小:162.44KB
数学建模.docx
《数学建模.docx》由会员分享,可在线阅读,更多相关《数学建模.docx(13页珍藏版)》请在冰点文库上搜索。
数学建模
江南大学
论文题目:
胃癌疾病的诊断
目录
一、摘要………………………………………….3
二、问题的提出……………………………………………….4
三、问题的分析……………………………………………….5-7
四、模型假设………………………………………………….8
五、定义符号说明…………………………………………….8-9
六、模型的建立与求解……………………………………….9-11
七、模型的分析……………………………………………….12
八、模型评价与推广………………………………………….12
九、参考文献………………………………………………….12-13
十、附录……………………………………………………….13-15
胃癌诊断的数学模型
一、摘要
胃癌在世界范围内是一种常见的恶性肿瘤,在我国胃癌的死亡率在各种恶性肿瘤中居首位,其发病率和死亡率都比较高,对人们的危害极大,因此对胃部有症状的病人,我们需要判断是否有癌!
胃癌患者很容易被误诊为萎缩性胃炎患者或非胃炎患者,每人化验4项生化指标:
血清铜蓝蛋白(X1)、蓝色反应(X2)、尿吲哚乙酸(X3)、中性硫化物(X4),对胃癌患者、萎缩性胃炎患者、非胃病者及正常人进行删选。
本文通过对胃癌患者、萎缩性胃炎患者、非胃病者体内的血清铜蓝蛋白(X1)、蓝色反应(X2)、尿吲哚乙酸(X3)、中性硫化物(X4)指标的不同,建立四种数学模型,来寻求一种直接可以判别病人是胃病患者还是萎缩性胃炎患者或非胃炎患者,在建模过程中我们应用了马氏距离判别法和MATLAB软件及常用数学运算,求到一种简单的直接可以判别的方法,但同时我们也将一些因素理想化,准确率并没有达到非常准确!
关键词:
胃癌、生化指标、马氏距离判别法、MATLAB
二、问题提出
胃癌患者容易被误诊为萎缩性胃炎患者或非胃病患者。
从胃癌患者中抽取5人(编号为1-5),从萎缩性胃炎患者中抽取5人(编号为6-10),以及非胃病者抽取5人(编号为11-15),每人化验4项生
化指标:
血清铜蓝蛋白(X1),蓝色反应(X2),尿吲哚乙酸(X3),中性硫化物(X4),测得数据如下图所示:
表1.从人体中化验的生化指标
N0.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
X1
228
245
200
170
100
255
130
150
120
160
185
170
165
135
100
X2
134
134
167
150
167
125
100
117
133
100
115
125
142
108
117
X3
0.2
0.1
0.12
0.07
0.20
0.07
0.06
0.07
0.1
0.05
0.05
0.06
0.05
0.02
0.07
X4
0.01
0.4
0.27
0.08
0.14
0.14
0.12
0.06
0.26
0.10
0.19
0.04
0.08
0.12
0.02
通过分析表格的数据,找到一种鉴别胃病的方法并用所给的数据进行检验。
三、问题分析
对于这个问题,我们首先想到的是对表一的数据进行宏观分析,
从数据的规律与联系找突破口,建立模型,给出判别的方法。
对X1,X2,X3,X4四项生化指标的均值做统计分布图,如下:
图2-1胃癌患者、萎缩性胃炎患者及非胃病者体内X1含量对比
编号
胃癌患者
萎缩性胃炎患者
非胃病者
1
228
255
185
2
245
130
170
3
200
150
165
4
170
120
135
5
100
160
100
图2-2胃癌患者、萎缩性胃炎患者及非胃病者体内X2含量对比
编号
胃癌患者
萎缩性胃炎患者
非胃病者
1
134
125
115
2
134
100
125
3
167
117
142
4
150
133
108
5
167
100
117
图2-3胃癌患者、萎缩性胃炎患者及非胃病者体内X3含量对比
编号
胃癌患者
萎缩性胃炎患者
非胃病者
1
0.2
0.07
0.05
2
0.1
0.06
0.06
3
0.12
0.07
0.05
4
0.07
0.1
0.02
5
0.2
0.05
0.07
图2-4胃癌患者、萎缩性胃炎患者及非胃病者体内X4含量对比
编号
胃癌患者
萎缩性胃炎患者
非胃病者
1
0.11
0.14
0.19
2
0.4
0.12
0.04
3
0.27
0.06
0.08
4
0.08
0.26
0.12
5
0.14
0.1
0.02
从图中看出,14号萎缩性胃炎患者体内X4元素含量整体略高于其他萎缩性胃炎患者。
综上,从所给样本数据看,胃癌患者、萎缩性胃炎患者及非胃病者体与健康人的体内4项元素化验指标有各自的。
有些元素如X2相差不大,其他元素如X1,X3,X4含量差异则很明显。
我们可以利用这些差异把胃癌患者、萎缩性胃炎患者及非胃病者体看作三个母本,对待测患者进行判别分析。
另外,由于第9位健康人的X3,X4元素、第6位患者的X1元素明显超过了其他人的水平,为了确保样本空间数据的可靠性与特征的明显性,我们可以将它们看做误诊。
四、模型假设
1)题中所给的内容和数据都是真实可信的。
2)除了表中列出的四项元素外,其他元素对是否患胃癌的影响很小。
3)假设病例没有其他元素导致某种元素不正常。
4)假设样品的估计平均值、协方差分别等于总体的平均值、协方差。
5)检验在同样的外界环境和生理状态下进行的。
五、符号说明
A胃癌患者的组成总体
B萎缩性胃炎患者组成总体
C非胃病患者
u1总体A的均值
u2总体B的均值
Si第i个总体的协方差阵
S第i个总体的协方差阵估计值
d样品到第i个总体的距离
G两个总体间的离差
Q两个总体内部的离差
I组间离差与组内离差的比值
Ci费希尔判别函数的系数
y判别函数临界值
Wi各指标对判别函数贡献权重
五.模型的建立与求解
1.问题分析
该问要求我们提出判别一个人属于胃癌患者和萎缩性胃炎患者以及非胃病者的方法,并检验所提方法的确性。
题目中表.1中给出了已经确诊为胃癌患者和萎缩性胃炎患者以及非胃病者的各5组数据;每一组数据都有4个数,分别代表了X1,X2,X3,X4在每个人体内的量;这就需要通过对15组数据的分析得出胃癌患者和萎缩性胃炎患者以及非胃病者体内这些元素量之差异,在寻找数据的差异时,我们想到的传统方法就是求数据的方差和均值。
而经判断,该问题属于判别问题,可以采用统计方法中的判别分析法进行分析处理。
题目中有三类——胃癌患者和萎缩性胃炎患者以及非胃病者,所以可采用二类群体的判别方法进行多次判别。
2.模型建立
我们采用二类群体判别中比较著名的Mahalanobis距离判别方法。
Mahalanobis距离判别
首先考虑一种简单而直观的判别方法——Mahalanobis距离判别。
其基本思想是根据两个母体样本计算出他们的均值向量和协方差阵,然后据此求取待测样本x对两个母本的Mahalanobis距离,二者取差值,判断离哪个母体近似。
设x,y是从均值为μ,协方差阵为Σ的总体A中抽取的样本,则总体A内两点x与y的Mahalanobis距离定义为:
d(x,y)=
定义样本x与A的Mahalanobis距离为:
d(x,A)=
在现实中,母体的均值向量和协方差阵由样本的均值向量和协方差阵来代替:
设x1,x2,…xn是来自母体A的个样本,y1,y2…yn是来自母体B的个样本,则样本的均值与协方差为:
i=1,2。
对于待测样本x如果两个母体样本的协方差相同,由
得到判别函数为:
,其中
,其判别准则是:
若
,则
;若
,则
。
如果两个母体样本的协方差不同,对于样本x判别函数定义为:
,
。
3.模型求解
为了验证这种方法的有效性,我们将题中所给的15组数据带入判别算法,进行准确率的验证,这种验证方法的合理性我们在模型检验部分进行了分析。
利用模型求解时通过matlab将以上两种算法编写成程序代码,通过手动输入样本,利用计算机进行求解,计算结果如下:
胃癌患者正确率
萎缩性胃炎患者正确率
非胃炎患者平均正确率
平均误诊率
马氏距离判别法
1
0.833333333
0.916666667
0.13312
求解结果发现马氏判别法检测出了83.33%的萎缩性胃炎患者的检测结果是正确的,而对于非胃炎者都给出了患病的判断,平均正确率91.67%,可见,这种判别方法都是十分有效的,但还不能做到100%判别正确。
六.模型的分析与检验
在给出这种判别方法后,我们着手对方法的有效性进行验证。
经过讨论,我们认为主要的验证思路有两种。
方案一:
对萎缩性胃炎与非胃病者的样本空间取一部分独立出来,通过把数据作为母体,建立判别函数,再把剩下的数据代入判别函数,比较判别结果与实际是否相符作为检验标准。
方案二:
把萎缩性胃炎与非胃病者的样本空间中的全部数据都用来建立判别函数。
然后,将用于产生判别函数的这些样本本身代入判别函数,计算判别的正确率,作为检验标准。
第一种方案比较容易理解,但我们经过分析,认为这样做也有一定的缺陷。
由于建立判别函数时只是用了一部分数据,那么由于从样本空间中获得的信息变少,必然会导致建立的判别函数在一定程度上不如用全部数据建立的判别函数更可靠。
因此,我们选择了第二种方案。
七.模型的评价与推广
虽然模型对就诊者判断的正确率没有达到100%,与实际还存在一定差距,存在的误判在现实中是很危险的。
但是模型的通用性强、与实际生活紧密相关,对医生的判断有一定的指导意义。
八、参考文献
[1]《数学模型》(第三版)姜启源等编写
[2]数学建模练习肾炎的诊断
[3]《数学建模案例精编》吴建国等编写
十、附录
胃癌编号
X1
X2
X3
X4
1
228
134
0.2
0.11
2
245
134
0.1
0.4
3
200
167
0.12
0.27
4
170
150
0.07
0.08
5
100
167
0.2
0.14
均值A
188.6
150.4
0.138
0.2
萎缩性
X1
X2
X3
X4
1
255
125
0.07
0.14
2
130
100
0.06
0.12
3
150
117
0.07
0.06
4
120
133
0.1
0.26
5
160
100
0.05
0.1
均值B
163
115
0.07
0.136
非胃病
X1
X2
X3
X4
1
185
115
0.05
0.19
2
170
125
0.06
0.04
3
165
142
0.05
0.08
4
135
108
0.02
0.12
5
100
117
0.07
0.02
均值C
151
121.4
0.05
0.09
MATLAB程序:
>>A=[228,134,0.2,0.11;245,134,0.1,0.4,;200,167,0.12,0.27;170,150,0.07,0.08;100,167,0.20,0.14]
A=
228.0000134.00000.20000.1100
245.0000134.00000.10000.4000
200.0000167.00000.12000.2700
170.0000150.00000.07000.0800
100.0000167.00000.20000.1400
>>A1=cov(A)
A1=
1.0e+003*
3.2648-0.7113-0.00100.0040
-0.71130.27230.0001-0.0004
-0.00100.00010.0000-0.0000
0.0040-0.0004-0.00000.0000
>>A2=inv(A1)
A2=
0.00120.00280.1444-0.1863
0.00280.01030.2963-0.3572
0.14440.2963333.696020.9275
-0.1863-0.357220.927593.4783
>>x=[255,125,0.07,0.14]
x=
255.0000125.00000.07000.1400
>>x1=x'
x1=
255.0000
125.0000
0.0700
0.1400
>>u=[188.6;150.4;0.138;0.2]
u=
188.6000
150.4000
0.1380
0.2000
>>y=x1-u
y=
66.4000
-25.4000
-0.0680
-0.0600
>>y1=y'
y1=
66.4000-25.4000-0.0680-0.0600
>>Z=y1*A2*y
Z=
4.6749
>>Z1=sqrt(Z)
Z1=
2.1621
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模