食品试验优化设计6.ppt
- 文档编号:18892819
- 上传时间:2024-02-09
- 格式:PPT
- 页数:74
- 大小:2MB
食品试验优化设计6.ppt
《食品试验优化设计6.ppt》由会员分享,可在线阅读,更多相关《食品试验优化设计6.ppt(74页珍藏版)》请在冰点文库上搜索。
第六章第六章直线回归与相关直线回归与相关客观事物在发展过程中是相互联系、相客观事物在发展过程中是相互联系、相互影响,常常要研究两个或两个以上变互影响,常常要研究两个或两个以上变量间的关系。
量间的关系。
下一张下一张主主页页退退出出上一张上一张下一张下一张主主页页退退出出上一张上一张1回归与相关的概念回归与相关的概念一类是完全确定性的关系,又称函数关系,可以一类是完全确定性的关系,又称函数关系,可以一类是完全确定性的关系,又称函数关系,可以一类是完全确定性的关系,又称函数关系,可以用精确的数学表达式来表示,即当变量用精确的数学表达式来表示,即当变量用精确的数学表达式来表示,即当变量用精确的数学表达式来表示,即当变量xx的值取的值取的值取的值取定后,变量定后,变量定后,变量定后,变量yy有唯一确定的值与之对应。
有唯一确定的值与之对应。
有唯一确定的值与之对应。
有唯一确定的值与之对应。
如长方形的面积(如长方形的面积(如长方形的面积(如长方形的面积(SS)与与与与长(长(长(长(aa)和宽(和宽(和宽(和宽(bb)的关的关的关的关系:
系:
系:
系:
S=S=abab。
它们之间的关系是确定性的,只要它们之间的关系是确定性的,只要它们之间的关系是确定性的,只要它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一知道了其中两个变量的值就可以精确地计算出另一知道了其中两个变量的值就可以精确地计算出另一知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为个变量的值,这类变量间的关系称为个变量的值,这类变量间的关系称为个变量的值,这类变量间的关系称为函数关系函数关系函数关系函数关系。
各种变量间的关系大致可分为两类:
各种变量间的关系大致可分为两类:
确定性关系确定性关系确定性关系确定性关系非确定性关系非确定性关系非确定性关系非确定性关系如人的身高与体重的关系,作物种植密度与产量的关如人的身高与体重的关系,作物种植密度与产量的关如人的身高与体重的关系,作物种植密度与产量的关如人的身高与体重的关系,作物种植密度与产量的关系,食品价格与需求量的关系等等,系,食品价格与需求量的关系等等,系,食品价格与需求量的关系等等,系,食品价格与需求量的关系等等,这些变量间都存在着这些变量间都存在着这些变量间都存在着这些变量间都存在着十分密切的关系,但不能由一个或几个变量的值精确地求十分密切的关系,但不能由一个或几个变量的值精确地求十分密切的关系,但不能由一个或几个变量的值精确地求十分密切的关系,但不能由一个或几个变量的值精确地求出另一个变量的值。
出另一个变量的值。
出另一个变量的值。
出另一个变量的值。
统计学中把这些变量间的关系称为统计学中把这些变量间的关系称为统计学中把这些变量间的关系称为统计学中把这些变量间的关系称为相相相相关关系关关系关关系关关系,把存在相关关系的变量称为,把存在相关关系的变量称为,把存在相关关系的变量称为,把存在相关关系的变量称为相关变量相关变量相关变量相关变量。
下一张下一张主主页页退退出出上一张上一张另一类是另一类是另一类是另一类是非确定性关系,不能用精确的数学公非确定性关系,不能用精确的数学公非确定性关系,不能用精确的数学公非确定性关系,不能用精确的数学公式来表示,当变量式来表示,当变量式来表示,当变量式来表示,当变量xx的值取定后,的值取定后,的值取定后,的值取定后,yy有若干种可有若干种可有若干种可有若干种可能取值。
能取值。
能取值。
能取值。
在一定范围内,对一个变量的任意数值(在一定范围内,对一个变量的任意数值(在一定范围内,对一个变量的任意数值(在一定范围内,对一个变量的任意数值(XXii),),),),虽虽虽虽然没有另一个变量的确定数值然没有另一个变量的确定数值然没有另一个变量的确定数值然没有另一个变量的确定数值yyii与之对应,但是却有一与之对应,但是却有一与之对应,但是却有一与之对应,但是却有一个特定个特定个特定个特定yyii的条件概率分布与之对应,这种变量的不确定的条件概率分布与之对应,这种变量的不确定的条件概率分布与之对应,这种变量的不确定的条件概率分布与之对应,这种变量的不确定关系,称为相关关系。
关系,称为相关关系。
关系,称为相关关系。
关系,称为相关关系。
一种是一种是因果关系因果关系,即一个变量的变,即一个变量的变化受另一个或几个变量的影响。
如小麦化受另一个或几个变量的影响。
如小麦的生长速度受遗传特性、营养水平、管的生长速度受遗传特性、营养水平、管理条件等因素的影响。
理条件等因素的影响。
另一种是另一种是平行关系平行关系,它们互为因果,它们互为因果或共同受到另外因素的影响。
如人的身或共同受到另外因素的影响。
如人的身高和胸围之间的关系属于平行关系。
高和胸围之间的关系属于平行关系。
下一张下一张主主页页退退出出上一张上一张相关变量间的关系一般分为两种相关变量间的关系一般分为两种:
研究研究研究研究“一因一果一因一果一因一果一因一果”,即一个自变量与一个依,即一个自变量与一个依,即一个自变量与一个依,即一个自变量与一个依变量的回归分析称为变量的回归分析称为变量的回归分析称为变量的回归分析称为一元回归分析一元回归分析一元回归分析一元回归分析;研究研究研究研究“多因一果多因一果多因一果多因一果”,即多个自变量与一个依,即多个自变量与一个依,即多个自变量与一个依,即多个自变量与一个依变量的回归分析称为变量的回归分析称为变量的回归分析称为变量的回归分析称为多元回归分析多元回归分析多元回归分析多元回归分析。
一元回归分析又分为一元回归分析又分为一元回归分析又分为一元回归分析又分为直线回归分析直线回归分析直线回归分析直线回归分析与与与与曲线回曲线回曲线回曲线回归分析归分析归分析归分析两种;多元回归分析又分为两种;多元回归分析又分为两种;多元回归分析又分为两种;多元回归分析又分为多元线性回归多元线性回归多元线性回归多元线性回归分析分析分析分析与与与与多元非线性回归分析多元非线性回归分析多元非线性回归分析多元非线性回归分析两种。
两种。
两种。
两种。
下一张下一张主主页页退退出出上一张上一张统计学上采用统计学上采用统计学上采用统计学上采用回归分析回归分析回归分析回归分析(regressionregressionanalysisanalysis)方法研究呈因果关系的相关变量间方法研究呈因果关系的相关变量间方法研究呈因果关系的相关变量间方法研究呈因果关系的相关变量间的关系。
的关系。
的关系。
的关系。
表示原因的变量称为自变量,表示结果表示原因的变量称为自变量,表示结果表示原因的变量称为自变量,表示结果表示原因的变量称为自变量,表示结果的变量称为依变量。
的变量称为依变量。
的变量称为依变量。
的变量称为依变量。
回归分析的任务就是揭示出呈因果关系回归分析的任务就是揭示出呈因果关系的相关变量间的联系形式,建立它们之的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量由自变量(原因)来预测、控制依变量(结果)。
(结果)。
回归分析主要包括:
找出回归方程;检回归分析主要包括:
找出回归方程;检验回归方程是否显著;通过回归方程来验回归方程是否显著;通过回归方程来预测或控制另一变量。
预测或控制另一变量。
对多个变量进行相关分析时,研究一个对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为变量与多个变量间的线性相关称为复相关复相关分析分析;研究其余变量保持不变的情况下两;研究其余变量保持不变的情况下两个变量间的线性相关称为个变量间的线性相关称为偏相关分析偏相关分析。
下一张下一张主主页页退退出出上一张上一张统计学上采用统计学上采用相关分析相关分析(correlationanalysis)来研究呈平行关系相关变量之间来研究呈平行关系相关变量之间的关系。
的关系。
对两个变量间的直线关系进行相关分析对两个变量间的直线关系进行相关分析称为称为简单相关分析简单相关分析(也叫(也叫直线相关分析直线相关分析););2直线回归直线回归2.1直线回归方程的建立直线回归方程的建立下一张下一张主主页页退退出出上一张上一张为了直观地看出为了直观地看出为了直观地看出为了直观地看出xx和和和和yy间的变化趋势,可将间的变化趋势,可将间的变化趋势,可将间的变化趋势,可将每一对观测值在平面直角坐标系中描点,作出散每一对观测值在平面直角坐标系中描点,作出散每一对观测值在平面直角坐标系中描点,作出散每一对观测值在平面直角坐标系中描点,作出散点图点图点图点图(见图见图见图见图6-16-1)。
2.1.1数学模型数学模型对于两个相关变量,一个变量用对于两个相关变量,一个变量用对于两个相关变量,一个变量用对于两个相关变量,一个变量用xx表示,另表示,另表示,另表示,另一个变量用一个变量用一个变量用一个变量用yy表示,如果通过试验或调查获得两表示,如果通过试验或调查获得两表示,如果通过试验或调查获得两表示,如果通过试验或调查获得两个变量的个变量的个变量的个变量的nn对观测值:
(对观测值:
(对观测值:
(对观测值:
(xx11,yy11),(),(),(),(xx22,yy22),),),),(,(,(,(xxnn,yynn)图图图图6-1x6-1x与与与与yy的关系散点图的关系散点图的关系散点图的关系散点图下一张下一张主主页页退退出出上一张上一张散点图可直观地、定性地表示了两个变量之间散点图可直观地、定性地表示了两个变量之间的关系。
为了探讨它们之间的规律性,还必须的关系。
为了探讨它们之间的规律性,还必须根据观测值将其内在关系定量地表达出来。
根据观测值将其内在关系定量地表达出来。
两个变量间有关或无关;若有关,两个变量两个变量间有关或无关;若有关,两个变量两个变量间有关或无关;若有关,两个变量两个变量间有关或无关;若有关,两个变量间关系类型,是直线型还是曲线型;间关系类型,是直线型还是曲线型;间关系类型,是直线型还是曲线型;间关系类型,是直线型还是曲线型;由散点图(由散点图(图图6-1)可以看出:
)可以看出:
两个变量间直线关系的性质(是正相关还是两个变量间直线关系的性质(是正相关还是两个变量间直线关系的性质(是正相关还是两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);负相关)和程度(是相关密切还是不密切);负相关)和程度(是相关密切还是不密切);负相关)和程度(是相关密切还是不密切);由于依变量由于依变量由于依变量由于依变量yy的实际观测值总是带有随机误的实际观测值总是带有随机误的实际观测值总是带有随机误的实际观测值总是带有随机误差,因而依变量差,因而依变量差,因而依变量差,因而依变量yy的实际观测值的实际观测值的实际观测值的实际观测值yyii可用自变量可用自变量可用自变量可用自变量xx的的的的实际观测值实际观测值实际观测值实际观测值xxii表示为:
表示为:
表示为:
表示为:
(ii=1,2,=1,2,nn)(6-16-1)若呈因果关系的两个相关变量若呈因果关系的两个相关变量若呈因果关系的两个相关变量若呈因果关系的两个相关变量yy(依变量)与(依变量)与(依变量)与(依变量)与xx(自变量)间的关系是直线关系,那么,根(自变量)间的关系是直线关系,那么,根(自变量)间的关系是直线关系,那么,根(自变量)间的关系是直线关系,那么,根据据据据nn对观测值所描出的散点图,如对观测值所描出的散点图,如对观测值所描出的散点图,如对观测值所描出的散点图,如图图图图6-16-1(bb)和和和和图图图图6-16-1(ee)所示。
所示。
所示。
所示。
式式式式中:
中:
中:
中:
,为为为为未知参数,未知参数,未知参数,未知参数,ii为相互独立,且服从为相互独立,且服从为相互独立,且服从为相互独立,且服从NN(00,)的随机变量。
这就是直线回归的的随机变量。
这就是直线回归的的随机变量。
这就是直线回归的的随机变量。
这就是直线回归的数学模型数学模型数学模型数学模型。
总体线性回归模型的图示YX观察值观察值总体线性回归模型总体线性回归模型因变量因变量自变量自变量参数参数随机误差随机误差yyyy条件平均数条件平均数条件平均数条件平均数下一张下一张主主页页退退出出上一张上一张设回归直线方程为设回归直线方程为:
(6-26-2)2.1.2参数参数,的估计的估计其中,其中,是是的估计值,的估计值,b是是的估计值。
的估计值。
最小二乘估计法最小二乘估计法建立建立样本线性回归方程的方法样本线性回归方程的方法最小二乘法最小二乘法实际观察值与样本回归线上实际观察值与样本回归线上的点的距离的平方和最小的点的距离的平方和最小xye1e2e3e4最小最小、b应使回归估计值应使回归估计值与实际观测值与实际观测值y的偏差平方和最小的偏差平方和最小,即:
,即:
总的离回归平总的离回归平方和,即剩余平方和方和,即剩余平方和根据微积分学中的求极值的方法,令根据微积分学中的求极值的方法,令Q对对a、b的一阶偏导数等于的一阶偏导数等于0,即:
,即:
最小最小(6-36-3)(6-46-4)经整理,得关于经整理,得关于a、b的的正规方程组正规方程组:
下一张下一张主主页页退退出出上一张上一张解正规方程组,得:
解正规方程组,得:
(6-56-5)(6-76-7)在在6-7式中,分子为自变量式中,分子为自变量x的离均差与依的离均差与依变量变量y的离均差的乘积和的离均差的乘积和,简,简称称乘积和乘积和,记作,记作,分母是自变量,分母是自变量x的离均的离均差平方和差平方和,记作,记作SSX。
所所所所以以以以a为为回归截距回归截距(regressioninterceptregressionintercept),是回归是回归直线与直线与y轴交点的纵坐标,当轴交点的纵坐标,当x=0时,时,;b为为回归系数回归系数(regressioncoefficientregressioncoefficient),表示,表示x变变化一个单位,化一个单位,y平均变化的数量;平均变化的数量;b的符号反的符号反映了映了x影响影响y的性质,的性质,b的绝对值大小反映了的绝对值大小反映了x影响影响y的程度;的程度;为为回归估计值回归估计值,是当,是当x在其在其研究范围内取某一个值时,研究范围内取某一个值时,y值平均数值平均数的估计值。
的估计值。
如果将如果将式代入(式代入(6-2)式,可得)式,可得到回归方程的到回归方程的中心化形式:
中心化形式:
下一张下一张主主页页退退出出上一张上一张性质性质1性质性质2性质性质3回归直线通过点回归直线通过点回归方程的基本性质:
回归方程的基本性质:
【例例6-1】食品感官评定时,测得食品甜度与食品感官评定时,测得食品甜度与蔗糖浓度的关系如表蔗糖浓度的关系如表6-2所示,试建立所示,试建立y与与x的的直线回归方程。
直线回归方程。
2.1.3计算示例计算示例蔗糖蔗糖质质量分数量分数x%1.03.04.05.57.08.09.5甜度甜度y1518192122.623.826表表表表6-26-2食品甜度与蔗糖浓度的关系食品甜度与蔗糖浓度的关系食品甜度与蔗糖浓度的关系食品甜度与蔗糖浓度的关系
(1)作散点图)作散点图以蔗糖质量分数以蔗糖质量分数(x)为横坐标,为横坐标,甜度(甜度(y)为纵坐为纵坐标作散点图,如标作散点图,如图图6-2所示。
所示。
图图6-26-2
(2)计算回归截距)计算回归截距a,回归系数回归系数b,建立直线建立直线回归方程回归方程下一张主页退出上一张首先根据实际观测值计算出下列数据:
首先根据实际观测值计算出下列数据:
首先根据实际观测值计算出下列数据:
首先根据实际观测值计算出下列数据:
所以,甜度所以,甜度所以,甜度所以,甜度yy对蔗糖质量分数对蔗糖质量分数对蔗糖质量分数对蔗糖质量分数xx的直线回归方程为:
的直线回归方程为:
的直线回归方程为:
的直线回归方程为:
然后计算出然后计算出然后计算出然后计算出bb、aa:
以上计算也可在回归计算表中进行。
以上计算也可在回归计算表中进行。
以上计算也可在回归计算表中进行。
以上计算也可在回归计算表中进行。
序号序号序号序号kkXXkkYYkkXXkk22XXkkYYkkYYkk22111.01.01.01.015.015.015.015.01.001.001.001.0015.015.015.015.0225.00225.00225.00225.00223.03.03.03.018.018.018.018.09.009.009.009.0054.054.054.054.0324.00324.00324.00324.00334.04.04.04.019.019.019.019.016.0016.0016.0016.0076.076.076.076.0361.00361.00361.00361.00445.55.55.55.521.021.021.021.030.2530.2530.2530.25115.5115.5115.5115.5441.00441.00441.00441.00557.07.07.07.022.622.622.622.649.0049.0049.0049.00158.2158.2158.2158.2510.76510.76510.76510.76668.08.08.08.023.823.823.823.864.0064.0064.0064.00190.4190.4190.4190.4566.44566.44566.44566.44779.59.59.59.526.026.026.026.090.2590.2590.2590.25247.0247.0247.0247.0676.00676.00676.00676.0038.038.0145.4145.4259.50259.50856.1856.13104.203104.20回归方程计算表回归方程计算表回归方程计算表回归方程计算表11(一级数据)(一级数据)(一级数据)(一级数据)XXkk=38.0=38.0YYkk=145.4=145.4n=7n=7x=5.4286x=5.4286x=5.4286x=5.4286y=20.7714y=20.7714y=20.7714y=20.7714XXkk22=259.50=259.50XXkkYYkk=856.1=856.1YYkk22=3104.20=3104.20(XXkk)22/n=206.2857/n=206.2857(XXkkYYkk)/n=789.3143/n=789.3143(YYkk)22/n=3020.1657/n=3020.1657LxxLxx=53.2143=53.2143LxyLxy=66.7857=66.7857LyyLyy=84.0343=84.0343b=b=LxyLxy/LxxLxx66.7857/53.214366.7857/53.21431.255b1.255b00=y-bxy-bx20.7714-1.25520.7714-1.2555.4286=13.95855.4286=13.9585Y=13.9585+1.255XY=13.9585+1.255X回归方程计算表回归方程计算表回归方程计算表回归方程计算表22(二级数据)(二级数据)(二级数据)(二级数据)注:
注:
注:
注:
xx,yy分别为分别为分别为分别为XX,YY的平均数的平均数的平均数的平均数根据直线回归方根据直线回归方根据直线回归方根据直线回归方程可作出回归直线,程可作出回归直线,程可作出回归直线,程可作出回归直线,见图。
从图看出,见图。
从图看出,见图。
从图看出,见图。
从图看出,并不是所有的散点并不是所有的散点并不是所有的散点并不是所有的散点都恰好落在回归直都恰好落在回归直都恰好落在回归直都恰好落在回归直线上,这说明线上,这说明线上,这说明线上,这说明用用用用去估计去估计去估计去估计yy是有偏差是有偏差是有偏差是有偏差的。
的。
的。
的。
下一张下一张主主页页退退出出上一张上一张附:
直线回归的偏离度估计附:
直线回归的偏离度估计偏差平方和偏差平方和偏差平方和偏差平方和的大小表示了实测点与回归的大小表示了实测点与回归的大小表示了实测点与回归的大小表示了实测点与回归直线偏离的程度,因而此偏差平方和又称为直线偏离的程度,因而此偏差平方和又称为直线偏离的程度,因而此偏差平方和又称为直线偏离的程度,因而此偏差平方和又称为离回归平离回归平离回归平离回归平方和方和方和方和。
统计学证明:
在直线回归分析中离回归平方和。
统计学证明:
在直线回归分析中离回归平方和。
统计学证明:
在直线回归分析中离回归平方和。
统计学证明:
在直线回归分析中离回归平方和的自由度为的自由度为的自由度为的自由度为nn-2-2。
那么,。
那么,。
那么,。
那么,离回归均方离回归均方离回归均方离回归均方为:
为:
为:
为:
离回归均方是模型(离回归均方是模型(离回归均方是模型(离回归均方是模型(6-16-1)中)中)中)中22的估计值。
的估计值。
的估计值。
的估计值。
离回归均方的平方根叫离回归均方的平方根叫离回归均方的平方根叫离回归均方的平方根叫离回归标准误离回归标准误离回归标准误离回归标准误,记为,记为,记为,记为,离回归标准误离回归标准误Syx的大小表示了回归直线与的大小表示了回归直线与实测点偏差的程度实测点偏差的程度,即回归估测值,即回归估测值与实与实际际观测值观测值y偏离(差)的程度,所以,用偏离(差)的程度,所以,用离回归离回归标准误标准误Syx来表示回归方程的偏离度。
来表示回归方程的偏离度。
下一张下一张主主页页退退出出上一张上一张对于对于对于对于【例例例例6.16.1】有有有有所以,离回归标准误为所以,离回归标准误为所以,离回归标准误为所以,离回归标准误为离回归平方和:
离回归平方和:
由上式计算出由上式计算出由上式计算出由上式计算出,然后求出离回归标准误,然后求出离回归标准误,然后求出离回归标准误,然后求出离回归标准误SyxSyx。
如果如果如果如果xx和和和和yy变量间并不存在直线关系,变量间并不存在直线关系,变量间并不存在直线关系,变量间并不存在直线关系,但由但由但由但由nn对观测值(对观测值(对观测值(对观测值(xxii,yyii)也可以根据上面介绍的方也可以根据上面介绍的方也可以根据上面介绍的方也可以根据上面介绍的方法求得一个回归方程法求得一个回归方程法求得一个回归方程法求得一个回归方程=aa+bxbx。
显然,这样显然,这样显然,这样显然,这样的回归方程所反应的两个变量间的直线关系是的回归方程所反应的两个变量间的直线关系是的回归方程所反应的两个变量间的直线关系是的回归方程所反应的两个变量间的直线关系是不真实的。
不真实的。
不真实的。
不真实的。
如何判断直线回归方程所反应的两如何判断直线回归方程所反应的两如何判断直线回归方程所反应的两如何判断直线回归方程所反应的两个变量间的直线关系的真实性呢?
这取决于变个变量间的直线关系的真实性呢?
这取决于变个变量间的直线关系的真实性呢?
这取决于变个变量间的直线关系的真实性呢?
这取决于变量量量量xx与与与与yy间是否存在直线关系。
间是否存在直线关系。
间是否存在直线关系。
间是否存在直
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 食品 试验 优化 设计