计算药物分析各章思考题docWord文件下载.docx
- 文档编号:8635877
- 上传时间:2023-05-12
- 格式:DOCX
- 页数:18
- 大小:85.88KB
计算药物分析各章思考题docWord文件下载.docx
《计算药物分析各章思考题docWord文件下载.docx》由会员分享,可在线阅读,更多相关《计算药物分析各章思考题docWord文件下载.docx(18页珍藏版)》请在冰点文库上搜索。
ε,ε是一个足够小的数。
应用牛顿-雷扶生法:
是一个足够小的数。
注意点:
1)收敛标准:
是一个足够小的数;
2)初始值:
(应尽量接近X值,且应避免f'
(X)=0)
3)可能有多个解
4,插值和拟合的区别是什么?
答:
二者的区别在于:
⑴函数插值与曲线拟合都根据一组数据构造一个函数为近似,但由于近似的要求不同,二者的数学方法上是完全不同的。
⑵若要求所求曲线(面)通过所给所有数据点,就是插值问题;
⑶若不要求曲线(面)通过所有数据点,而是要求它反映对象整体的变化趋势,这就是数据拟合,又称曲线拟合或曲面拟合。
5,比较两种软件:
Excel,Matlab的特点
Excel电子表格:
是office办公软件,为数据库,实用普遍,灵活通用,功能强大,易于操作,应用于数据记录、数学运算、统计分析、曲线拟合、绘图、财务分析、数据库储存管理等功能,有许多内置的函数可用来完成化学和药学中的计算任务。
在化学和药学的数据处理及相关科研工作中,excel电子表格程序被广泛应用于存储,分析和管理数字和文本数据。
Matlab:
是一种专业软件,作为一种编程语言和可视化工具,可解决工程、科学计算和数学学科中的许多问题。
Matlab建立在向量、数组和矩阵的基础上,使用方便,人机界面直观,输出结果可视化。
矩阵是matlab的核心。
Matlab程序的特点:
1)提供了灵活开放的编程和应用环境以及一种全新的编程语言,其语法规则简单,很贴近人的思维方式;
2)Matlab具有丰富的图形处理功能;
3)Matlab具有强有力的运算工具,几乎应有尽有的标准函数,能够方便地应用于化学和药学中的计算问题;
4)Matlab语言在矩阵运算的方面显得特别简捷、高效和方便。
第三章
1,名解:
u检验:
在总体标准差σ已知且稳定的条件下,检验实际测量所得的平均值X是否来自同一个正态母体
或检验两组样品是否取自同一总体。
t检验:
在样品均值的标准偏差已知的条件下,对样品均值进行的统计检验,即相当于少量实验数据的u检验。
中位数:
将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。
方差分析:
对实验数据的方差进行分析;
方差分析就是建立在平方和的加和性基础上,应用F检验进行不同来源变异均方的比较,检验不同组数据的精密度是否存在显著性差异,由此推断不同组测定的均数之间有无显著性差异。
Χ²
试验:
统计学的研究指出,当从总体方差为σ2的正态分布总体中随机抽取容量为n的样本,测量值的方差S2和σ2间的关系服从χ2分布。
χ2检验可用于方差显著性检验和各种拟合优度检验,如常常用于实验结果和期望值或理论值之间的的显著性检验。
χ2检验的基本公式是
,式中Oi是观察到的实际频率,Ei是理论频率。
Boxplot:
把一组实验数据从小到大排列,计算得其中位数X,前四分位数FL、后四分位数FU、两个四分位数之间的差值df,可设定溢出范围为小于FL-1.5df和大于FU+1.5df的值,绘制盒图:
以一个长方形的盒子表示FL—FU的试验点,从盒图的两侧各绘一条水平线,称为盒尾,包括所有的正常值,而溢出值在盒尾外侧,此种描述一维数据的图称为盒图。
2,试说明实验数据统计检验的基本方法
对实验数据进行统计分析,一般是将实验数据整理概括成统计性样本的数字特征,即均值和标准差,然后按以下步骤进行:
⑴确定统计分析目的,选择统计检验方法;
⑵建立检验假设H0(原假设)和H1(对立假设),计算检验用的统计量Q。
⑶选择显著性水平
;
⑷将计算得到的统计量和统计检验表对照得出肯定或否定检验假设的结论。
显然,显著性水平
越小,可接受的概率P越大,P=1-
。
假设检验的过程就是比较计算统计量Q和能满足P≥1-
需要的最小统计量Q0(统计表格值)。
若Q>Q0,则拒绝假设H0,接受H1,反之,则接受H0,拒绝H1。
3,对两组实验数据进行准确度差别检验(即t检验)时应该注意什么问题?
应用t检验应注意:
⑴t检验的应用要求假定两组数据的精密度不存在显著差异,即方差齐性,为此须应用F检验来判断。
当方差齐性不能满足时,可按科克伦公式进行t检验;
⑵显著性水平的选取应视实际情况而定:
α是限制发生第一类错误(以真为假)的保证;
⑶检验顺序:
Q/G检验→F检验→t检验
4,单因素和双因素方差分析有何区别,举例说明其使用方法
区别:
项目
单因素方差分析
双因素方差分析
分析对象
一个处理因素的多个水平
两个处理因素(可有多个水平)
目的
比较该因素多个水平间的效应
比较两个因素(A,B)的影响大小及相互之间的作用
变差平方和Q总
Q总=Q组间+Q组内
Q总=QA+QB+QAB+Q误差效应
举例见课本P49及P51
5,什么是非参数统计分析?
和经典的优化方法有何区别?
非参数统计分析即统计假设不依赖于总体分布的均值、方差等参数的统计分析方法。
两者区别:
⑴经典优化方法:
要求研究体系总体符合正态分布或测试次数足够多(此时实验数据可按正态分布处理),统计假设依赖于总体分布的均值、方差等参数;
⑵非参数统计分析:
不要求了解总体的分布,不依赖于总体分布的均值、方差等参数,也不要求连续变量的数据,方法简便,直观,检验的功效能够满足要求,适用性较强。
第四章
Optimization/优化:
通过实验或数据分析寻找指标最优值的实验条件的过程,即研究如何设计实验条件使指标获得最优值。
响应面:
系统响应或评价函数对因素的函数。
网格搜索法:
网格法就是在变量区域内打网格,在网格点上求约束函数与目标函数的值,对于满足约束条件的点,再比较其目标函数的大小,从中选择小者,并把该网格点作为一次迭代的结果。
然后在求出的点附近将分点加密,再打网格,并重复前述计算与比较,直到网格的间距小于预先给定的精度,终止迭代。
优化指标:
在试验设计中衡量试验效果的变量,又称为试验指标。
析因试验:
是将各因素的全部水平按一定规则相互组合,按照设计的析因设计表进行试验,以考察各因素主效应以及因素之间的交互效应的优化实验设计方法。
正交设计:
是研究多因素多水平的试验设计方法,用正交表安排试验的方法称为正交设计,各因素水平数相等时正交表壳表示为
,s为可安排的因素数目(正交表的纵列数),t为水平数,n为试验次数(正交表的横行数),具有“均匀分散,整齐可比”的特点。
均匀设计:
抛开正交设计中的“整齐可比”性的特点,只考虑试验点的“均匀分散”性,即使试验点在所考察的范围内均匀分布,按此原则以均匀表来安排试验。
均匀表的表头形式为
,U表示均匀数,s为可安排的因素数目,t为水平数,n为试验次数,这里n=t,s=t-1(最多可安排的因素数比水平数少1)
黄金分割法:
将搜索区间分为两个不相等的部分,使其中较大的部分与整个区间的比值和较小的部分与较大部分比值相等,即使搜索区间缩小为原来的0.618,利用此不等见距点的评价计算寻优,使每一次计算都提供一个新的有用的数据,并按此重复,属于序贯优化。
改良单纯形法:
完成起始单纯形试验点后,在响应值最差点的反位顶点处安新实验,且在搜索最优区域过程中,除了运用“反射”操作外,允许单纯形“扩展”,“压缩”和“整体压缩”,加速单纯形向最优点区域推进。
2,举例说明常用优化方法的分类方法
[1]单指标优化和多指标优化
仅有一个指标就可以对实验效果进行评价,这种优化称为单指标优化;
有时需要使用多于一个的指标进行效果评价,这类优化称为多指标优化。
[2]黑箱式优化和解析式优化
如果不能得到评价函数和因素间的函数关系即响应面函数,而只寻求实验指标最优的诸因素的取值,其寻优方式称为“黑箱式”优化;
能够得到响应面的函数,对整个实验区间内所有控制因素的取值的响应值将都是已知的,优化点的确定将很容易用数值算法计算得到,其寻优方法称为“解析式”优化。
[3]并行优化、序贯优化
并行优化是指通过试验设计对有关因素的水平规划后,同时进行诸因素各水平的试验,并由试验数据综合分析结果,直接求出最优条件。
如正交试验设计和均匀试验设计。
序贯优化是指通过序贯的进行系列实验达到优化,每进行一次或少量次试验后,先分析已取得的试验结果,预测优化的可能方向,在此基础上设计新的试验,重复进行直至求得最优解。
如黄金分割法和单纯形法。
3,什么叫响应面?
根据实验结果建立的数学模型和响应面不符合时将会产生什么问题?
响应面是系统响应或评价函数对因素的函数,研究响应面的特点能够帮助我们了解各因素的改变是如何影响优化指标的。
实验结果建立的数学模型和响应面不符合时将会产生很大的误差,导致对因素影响优化指标的方式的错误认识,也会导致优化区域的错误判断而无法找到最优化解。
4,试说明均匀设计和正交设计的区别
⑴正交设计法是利用数理统计学观点,从全面实验的点中选出具有代表性的点进行实验设计。
被选出的点具有“均匀分散,整齐可比”的特点,实验点数多(至少为水平数的平方)。
⑵均匀设计法是方开泰将数论与多元统计相结合,在正交设计法的基础上,单纯从“均匀分散”性出发,不考虑“整齐可比”的实验设计方法。
实验点数大幅减少(等于水平数)。
5,简述改良单纯形法寻优方法的基本思路,并分析该法的优缺点
基本思路:
⑴以单纯形顶点的坐标作为实验各因素的数值,首先按照起始单纯性的n+1个顶点的坐标安排n+1个试验;
⑵然后比较这些试验结果,淘汰其中指标值最差的试验点;
⑶在可能改进试验效果的方向(一般总是为最差点的反对称方向),新增一个试验点,试验后再确定新的试验点,直至按一定规则确定新的单纯形,开始下一轮的搜索。
补充:
在搜索最优区域过程中,除了运用“反射”操作外,允许单纯形“扩展”,“压缩”和“整体压缩”。
优点:
⑴不仅可以一维,还可以多维因素优化。
⑵与析因分析相比,每增加一个因素,单纯形法仅增加一个试验点,比析因试验较多的实验次数显得经济。
缺点:
⑴单纯形法属于黑箱操作法,只能盲目地根据实验结果来确定优化方向,而不能全面了解设计空间的响应面。
可能选出的是局部优化点,如要选出最优点,应当选择好初始点。
⑵在处理较高维的问题时收敛速度往往较慢。
第五章
控制图:
是经常使用的质量评定技术之一。
最常用的控制图是用同一标准方法对同一标准样品测试20次以上,求出其平均值x和标准偏差S,在坐标纸上以x为中线,以±
2S为警戒线,以±
3S为控制限,依次标绘实验点并连成线,即得到控制图。
分析方法的验证:
一个实验室在建立一个新方法或第一次使用一个新方法时,对该方法的适用性和可靠性进行测定的过程,旨在保证分析测试结果的可靠性和准确性,并保证所建立的方法能被同行重复和验证,发表以后能被他人应用,得到普及,具有实用价值。
中间精密度:
同一实验室,不同时间由不同分析人员用不同设备所得测试结果之间的接近程度。
专属性:
指在其他成分(杂质、降解物、辅料等)可能存在情况下采用的方法能准确测定出被测物的特性。
灵敏度:
指的是分析信号随组分含量变化的大小。
检测限:
指在确定的实验条件下,被测物能被检测出的最低浓度或含量。
耐用性:
指在测定条件有小的变动时,测定结果不受影响的承受程度。
标准加入法:
将一系列不同已知浓度的待测组分的标准溶液加入到待测样品溶液中,平行测定并绘制校正曲线,以回归曲线外推法求得待测样品含量的方法。
2,如何考验定量分析方法的精密度?
考验方法:
在规定的测试条件下,对同一个均匀样品,多次重复取样测定(测定9次如制备三个不同浓度样品,各测三次或把被测物浓度当作100%,至少测6次),然后对所得的结果进行偏差、标准偏差或相对标准偏差的计算,并经过方差分析等统计方法来判断多次测定结果之间的接近程度。
(重复性、中间精密度和重现性等不同的精密度表现形式有不同的测试条件:
人员、日期和设备仪器等)
数据要求:
需报告SD,RSD和可信限。
3,为什么要对建立的分析方法进行验证?
如何验证?
目的在于证明所采用的分析方法适用于相应的检测要求;
意义在于保证分析测试结果的可靠性和准确性,并保证所建立的方法能被同行反复和验证,发表以后能被他人应用,得到普及,具有实用价值,即使分析方法标准化和规范化。
一般验证项目有准确度、精密度、专属性、检测限、线性范围、耐用性等。
不同的分析方法验证的内容和要求并不相同,应根据规定进行
验证内容:
[1]准确度是指用该方法测定的结果与真实值或参考值接近的程度,用百分回收率表示
[2]精密度是指在规定条件下,同一个均匀样品,经多次取样测定所得结果之间的接近程度。
用偏差(d)、标准偏差(SD)、相对标准偏差(RSD)(变异系数,CV)表示。
[3]检测限系指试样在确定的实验条件下,被测物能被检测出的最低浓度或含量。
属限度检验效能指标,无需定量测定,只要指出高于或低于该规定浓度即可。
可用非仪器分析目视法,或者以信噪比(S/N)3∶1或2∶1时的相应浓度或注入仪器的量确定检测限。
[4]定量限(1imitofquantitation,LOQ)指样品中被测物能被定量测定的最低量,结果应具有一定准确度和精密度要求。
常用信噪比法确定定量限,一般以信噪比(S/N)为10∶1时相应的浓度或注入仪器的量进行确定,也可用仪器所测空白背景响应标准差(SD)的10倍为估计值,再经试验确定方法的实际测定下限。
[5]专属性指有其他成分(杂质、降解物、辅料等)可能存在情况下采用的方法能准确测定出被测物的特性,能反映该方法在有共存物时对供试物准确而专属的测定能力,是指该法用于复杂样品分析时是否受到相互干扰程度的度量。
可用鉴别反应和含量测定和杂质测定。
[6]线性指在设计的范围内,测试结果与试样中被测物浓度直接呈正比关系的程度。
通常用最小二乘法处理数据求得回归曲线的斜率来表示。
[7]范围指达到一定精密度、准确度和线性的条件下,测试方法适用的高、低限浓度或量的区间。
范围的确定可因测定项目不同而有不同要求
[8]耐用性系指在测定条件有小的变动时,测定结果不受影响的承受程度。
一般属于实验室内方法研发和验证环节。
4,为什么要进行回收率试验?
如何进行回收率试验?
要进行回收率实验来考察方法的准确度,对已知标准品加入量的样品用待评定的方法测定其含量作为回收量,计算回收量和加入量的百分比作为方法的百分回收率,用以表示准确度。
测定回收率R的具体方法可采用“回收试验法”和“加样回收试验法”。
回收试验:
空白+已知量A的对照品(或标准品)测定,测定值为M,回收率
加样回收试验:
已准确测定药物含量P的真实样品+已知量A的对照品(或标准品)测定,测定值为M,加样回收率
规定的范围内,至少用9次测定结果评价,如制备高、中、低三个不同浓度样品各测三次
5,专属性验证对有关物质检查方法的建立有何意义?
如何考察分析方法的专属性?
意义:
专属性能反映分析方法在有其他干扰成分存在时对供试物准确而专属的测定能力,是指该法用于复杂样品分析时受到干扰程度的度量。
因而有关物质的检查方法必须经过专属性验证,以排除其他成分的干扰,使有关物质能够与样品主成分等共存物区别开而得到准确、专一的检查和测定。
考察方法:
①鉴别反应:
待测样品、不含待测组分的样品以及含有结构相似或组分中的有关化合物等干扰物的样品平行试验,只有待测样品呈正反应,其他均应呈负反应。
②含量测定和杂质测定:
加有杂质、降解产物、有关化学物质、安慰剂成分的,或经过破坏性试验的,或加入粗品的样品与待测样品进行平行试验,测定结果进行比较(专属性可用两组数据的差值,或两组数据的统计分析如t检验、F检验的结果进行评价)。
色谱法和其他方法,应附代表性图谱,亦可说明专属性。
图中应标明各组份的位置,色谱法中的分离度应符合要求。
6,检测限和定量限有何区别?
和灵敏度有何区别?
如何研究分析方法的检测限?
⑴检测限和定量限的区别:
检测限
定量限
备注
定义
被测物能被检测出的最低量
被测物能被定量测定的最低量
对于表达形式:
A/C为校正曲线的斜率,表示被测组分的浓度改变一个单位时校正曲线上分析信号的变化量
要求
无
测定结果应具有定量分析方法应达到的准确度和精密度
分类
仪器检测限,方法检测限和样品检测限
表达形式(信噪比法/标准偏差法)
S/N=3或2
D=C*3σ/A
S/N=10
D=C*10σ/A
大小关系
由于受到校正曲线在低浓度区域的非线性关系、试剂纯度和污染等因素的影响,定量限高于检测限
⑵检测限和灵敏度的区别:
灵敏度
分析信号随组分含量变化的大小
影响因素
与检测器的放大倍数相关
与测定噪声相关,且有明显的统计意义
表示方法
或信噪比S/N=3或2时的浓度
校正曲线的斜率
⑶检测限的研究方法:
①非仪器分析目视法:
用已知浓度的被测物,试验出能被可靠地检测出的最低浓度或量。
②信噪比法:
用于能显示基线噪音的分析方法(仪器分析方法),是把已知低浓度试样测出的信号与空白样品测出的信号进行比较,算出能被可靠地检测出的最低浓度或量。
一般以信噪比(S/N)3∶1或2∶1时的相应浓度或注入仪器的量确定检测限。
③标准偏差法:
(1)空白值=0时;
①测定背景10次以上,求出标准差σ。
②将σ乘以三倍;
③在工作曲线上求出3σ相对应的浓度C
(2)空白值不等于0;
①测定背景10次以上,求出标准差σ
③在工作曲线上求出3σ相对应的浓度C;
④将求得的对应浓度值加上空白值即得该方法的检出限。
第六章
模式识别:
认识出某个样品与哪一种供模仿用的样品相同或相似,借助数学方法和计算机技术揭示事物内部规律和隐含性质,对若干类样本进行分类或判别的一种多元分析方法。
聚类分析:
属于无监督模式识别。
只要思路是同类样本应彼此相似,相似的样本在多维空间中彼此距离应小些,不同类的样本彼此距离应大些,所以聚类分析是研究“物以类聚”的一种多元统计方法,即如何使相似的样本“聚”在一起,从而达到分类的目的。
有监督模式识别:
数据中有一部分是已知模式的样本,通过对处理过的数据进行试验,识别未知类别的样本属于不同的类别。
另解:
利用训练集,通过训练或学习来获得识别准则(或判别函数),然后用这些识别好的准则来判别未知模式所属类别,并利用预测集,对训练集中获得的识别准则加以检测,来考察识别准则的可靠性与正确性。
降维技术:
处理多变量数据(当变量数超过3)时,通过绘图或计算机屏幕显示的方式直观地观察图形并识别其特征不再可能,这时就需要将多维的数据在二维或三维的空间中显示出其最大多数的信息,这种技术称为降维技术。
主成分分析:
将多个变量通过数学变换以选出较少个重要且两两不相关的新变量来描述样本,建立简化的数学模型,以便更多、更好地从数据矩阵获得信息的一种多元统计分析方法。
设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法
线性判别分析:
通过一定的方法将空间各点投影到维数较低的空间(通常为一维空间)中,并在该低维数空间中进行合理的分类的多元统计分析方法。
KNN法:
(K-最近邻域判决法)计算未知样本到所有已知样本的距离(通常是欧氏距离),再直接以模式识别的基本假设“同类样本在模式空间相互较靠近”为依据,选择最小的距离并将该样本归属给相应的类的一种分类方法。
2,列举几种在药学领域中模式识别的应用方法
⑴药物定量构效关系QSAR的研究
研究如何从物质的化学成分和结构定量预测其化学特性。
QSAR从其本质上和化学模式识别有着密切的关系,研究样本是化合物分子结构与活性之间的隐含关系。
如用SIMCA模式识别代替多元回归分析对肾上腺素受体的苯乙胺激动剂和拮抗剂药物的构效关系研究,预示激动剂分类的正确率为100%,对拮抗剂分类预示正确率为88%;
⑵对化学指纹谱的模式识别
应用模式识别方法研究色谱化学指纹图谱和药材及中成药的产地、品种、质量等特性的关系。
通过对植物挥发油的红外光谱的强峰峰位编码后进行系统的模式识别,能成功识别醛、酮、酯、羧酸、醇等化合物类别,并预测未知化合物的类别。
⑶在实验方法优化中的应用
应用模糊聚类方法根据5种分子作用力数据对80余种有机溶剂进行分类,并用于建立和筛选薄层色谱展开剂系统,用于定性分析139种生物碱,使得工作效率大为提高。
此外,在临床药物分析中,模式识别应用于对肝功能生化数据和血清胆酸测定数据的模式识别;
对特发细菌性腹膜炎的早期检测等
3,说明应用模式识别技术时对数据进行预处理的基本方法
⑴遗漏数据:
不宜用0替代,而用行或列的平均来替代,或者使用随机数来替代。
⑵消除数据量纲不同或分布范围过大造成的常数偏移量,可以对坐标原点做变换:
——均值中心化处理:
⑶比例调整以消除样品不同性质之间的差异(即不同变量具有不同的绝对值和变量范围),常用方法:
①范围调整:
②正规标准化处理:
⑷另一常用的方法是将原始数据变换坐标系,用于各种模式识别方法。
思路是根据原始数据矩阵得到一个可以反映原始数据中各数据点之间关系的数据矩阵;
即方差-协方差矩阵或相关矩阵
4,在主成分分析中如何确定主成分的数目?
⑴最常用的方法是计算方差百分数。
将计算得到的主成分按特征值由大到小的顺序排列,也就是按照它们的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算 药物 分析 各章 思考题 doc