市场研究中的数据分析方法.ppt
- 文档编号:18859771
- 上传时间:2024-02-01
- 格式:PPT
- 页数:52
- 大小:162KB
市场研究中的数据分析方法.ppt
《市场研究中的数据分析方法.ppt》由会员分享,可在线阅读,更多相关《市场研究中的数据分析方法.ppt(52页珍藏版)》请在冰点文库上搜索。
市场研究的数据分析方法市场研究的数据分析方法第一节线性回归分析第一节线性回归分析一、线性回归方程的基本模型一、线性回归方程的基本模型线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。
线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式-回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。
1、一元线性回归模型、一元线性回归模型模型是:
式中:
为被解释变量(因变量);为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,与是待估参数,称为回归常数,为回归系数。
ii10ixyyx01012、多元回归模型、多元回归模型多元线性回归模型中自变量的个数在2个以上,模型的一般形式为:
i=1,2n其中,为被解释变量(因变量),为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,为k+1个待估参数,为回归常数,称为回归系数。
ikiki22i110ix.xxyyk21x,.,x,xk210,.,k21,.,0在应用线性回归模型时,必须满足以下假设:
在应用线性回归模型时,必须满足以下假设:
(1)解释变量是确定性变量,而且解释变量之间不相关。
(2)随机误差项具有0均值和同方差。
(3)随机误差项在不同样本点之间是独立的,不存在序列相关。
(4)随机误差限于解释变量之间不相关。
(5)随机误差项服从0均值和同方差的正态分布。
k21x,.,x,x二、线性回归方程的统计检验二、线性回归方程的统计检验1、回归方程拟合优度检验2、回归方程的显著性检验3、回归系数显着性检验三、回归分析假设条件的检验三、回归分析假设条件的检验1、残差分析2、多重共线性3、误差项的序列相关四、线性回归分析的基本步骤四、线性回归分析的基本步骤1、确定回归中的自变量和因变量。
2、从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程。
3、对回归方程进行各种统计检验。
4、利用回归方程进行预测。
例:
CheckersPizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对手是欧文公司,提供相同的产品与服务。
另外麦当劳也是它的一个重要竞争者。
在过去的24个月中,该公司的销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文公司产品的价格(P欧文)以及麦当劳产品的价格(P麦当劳)。
假定下个月公司产品价格为9.05,人均收入为26614元,欧文公司产品的价格10.2元,麦当劳产品的价格为1.15元,请预测该公司下个月的销售量。
五、实例分析五、实例分析首先CheckersPizza公司根据资料估计下面的线性需求方程的参数:
Q=a+bP+cM+dPQ=a+bP+cM+dP欧文欧文欧文欧文+ePeP麦当劳麦当劳麦当劳麦当劳式中:
Q比萨饼的销量;P比萨饼的价格M小镇居民的人均收入P欧文欧文公司产品的价格P麦当劳麦当劳产品的价格下面是SPSS11.0的输出结果:
ModelSummaryModelSummary.985a.970.96434.70896Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:
(Constant),P麦当劳,P欧文,M,Pa.ANOVAANOVAbb736912.314184228.078152.923.000a22889.523191204.712759801.8323RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:
(Constant),P麦当劳,P欧文,M,Pa.DependentVariable:
Qb.CoefficientsCoefficientsaa-343.784414.076-.830.417-195.89511.041-1.037-17.743.0007.472E-02.010.4057.359.000174.40331.712.2325.500.00081.05722.166.1663.657.002(Constant)PMP欧文P麦当劳Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.DependentVariable:
Qa.从上面的输出结果可以看出,模型可以解释97%的比萨饼销售量的变化;模型整体非常显著,F统计的相伴概率值P=0.000;四个参数b、c、d、e非常显著,T统计的相伴概率值P都远小于0.01。
所以,回归方程为:
Q=-Q=-343.748343.748-195.895P+0.0742M+174.403P195.895P+0.0742M+174.403P欧文欧文+81.057+81.057PP麦当劳麦当劳该公司下一个月比萨饼的销量为;Q=-Q=-343.748343.748-195.895*9.05+0.0742*26614+174.403*10.2+81.057195.895*9.05+0.0742*26614+174.403*10.2+81.057*1.15*1.151730.28721730.2872第二节判别分析第二节判别分析一、判别分析法的基本思想一、判别分析法的基本思想判别分析包括以下两步:
1、分析和解释各类指标之间存在的差异,并建立判别函数。
2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。
二、判别分析基本模型与统计术语二、判别分析基本模型与统计术语
(一)假设条件1、每一个类别都取自一个多元正态总体的样本2、所有正态总体的协方差矩阵或相关矩阵都相等
(二)基本模型1、先验概率2、后验概率3、判别系数4、结构系数5、分组的矩心6、判别力指数7、残余判别力(三)统计术语(三)统计术语三、分析的基本步骤三、分析的基本步骤判别分析一般都是通过现成的统计软件进行分析。
一般而言,利用统计软件的判别分析具体包括以下步骤:
确定研究确定研究的问题的问题获取判别分获取判别分析的数据析的数据进行判别进行判别分析分析评价和解释评价和解释分析结果分析结果某公司生产一新产品,该公司在新产品末大量上市以前,进行了一次市场调查。
公司将新产品寄给十五个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。
评估的因素有:
式样、包装及耐久性。
评分用10分制,高分表示特性良好,低分则较差。
其中有三位代理商没有表明自己的购买意愿。
那么这些代理商是属于“非购买组”还是“购买组”?
四、实例分析四、实例分析以下是SPSS11.0的部分出果输结:
StandardizedCanonicalDiscriminantStandardizedCanonicalDiscriminantFunctionCoefficientsFunctionCoefficients.910.083.254式样包装耐久性1Function表中,式、包装和耐用性的准化系分样标数别为0.91、0.083、0.254。
因而,式是最重要的判量样别变,其次是“耐用性”,最后是包装。
CasewiseStatisticsCasewiseStatistics11.50011.000.4542.00017.8772.15511.4201.969.6512.0317.548.67411.16411.0001.9352.00024.4522.87211.6481.991.2082.0099.5951.02411.9251.999.0092.00113.3131.57511.9691.998.0012.00212.3581.44211.3911.963.7362.0377.269.62322.6181.989.2491.0119.336-1.57522.7601.995.0941.00510.550-1.76722.1311.7212.2811.2794.177-.56322.57211.000.3191.00016.962-2.63822.08011.0003.0641.00028.136-3.823ungrouped2.3871.962.7481.0387.230-1.208ungrouped1.6481.991.2082.0099.5951.024ungrouped2.7991.996.0651.00410.885-1.81811.66331.0001.5842.00018.18911.8003.9611.0062.0397.39811.17831.0004.9102.00031.80011.2473.9644.1422.03610.72412*.0003.97485.9341.02693.19411.8623.996.7482.00411.65511.6463.9451.6602.0557.36222.9343.984.4281.0168.69822.0623.9467.3201.05413.04221*.09131.0006.4572.00021.79022.57431.0001.9941.00017.42822.02731.0009.2081.00045.539CaseNumber123456789101112131415123456789101112OriginalCross-validatedaActualGroupPredictedGrouppdfP(Dd|G=g)P(G=g|D=d)SquaredMahalanobisDistancetoCentroidHighestGroupGroupP(G=g|D=d)SquaredMahalanobisDistancetoCentroidSecondHighestGroupFunction1DiscriminantScoresFortheoriginaldata,squaredMahalanobisdistanceisbasedoncanonicalfunctions.Forthecross-validateddata,squaredMahalanobisdistanceisbasedonobservations.Misclassifiedcase*.Crossvalidationisdoneonlyforthosecasesintheanalysis.Incrossvalidation,eachcaseisclassifiedbythefunctionsderivedfromallcasesotherthanthatcase.a.表中最大率一是判分析得出的。
概组栏别组别13、15代理商于“非”号属购买组,14代理商于“”号属购买组。
第三节聚类分析一、聚类分析的基本思想一、聚类分析的基本思想聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。
样品聚类是对事件进行聚类,或是说对观测量进行聚类,是对反映被观测对象的特征的变量值进行分类。
变量聚类则是当反映事物特点的变量很多时,根据所研究的问题选择部分变量对事物的某一方面进行研究的聚类方法。
二、距离与相似系数二、距离与相似系数
(一)常用的距离指标有1、欧式距离2、欧式距离的平方3、曼哈顿距离4、切比雪夫距离
(二)常用的相似系数指标主要有1、余弦系数2、皮尔逊相关系数(三)定类数据的距离1、卡方距离2、法方距离三、聚类方法三、聚类方法1层次聚类法2迭代聚类法四、聚类分析的主要步骤四、聚类分析的主要步骤确定研究的问题计算相似性聚类聚类结果的解释和证实某家具公司为了对市场进行的细分,对购买家具的顾客进行了一次市场调查。
这次调查的指标有:
喜爱的款式(老式为1,新式为2),图案(素式为1,格字为2,花纹为3);颜色(蓝色为1,黄色为2,红色为3,绿色为4)。
调查样本为30人。
五、实例分析:
五、实例分析:
顾客式样图案颜色123456789101112131415161718192021222324252627282930112212121212121121221212212121323312132132312232132323131132124323241143224324143432142243根据聚类结果,这30名顾客分为3类,可以较好的反映这些顾客对家具的偏好类型:
第一类:
1,9,13,17,24第二类:
2,3,4,5,6,7,8,11,12,15,16,18,20,21,22,23,26,28,29,30第三类:
10,14,19,25,27第四节第四节因子分析因子分析一、因子分析的基本思想一、因子分析的基本思想因子分析是一项多元统计分析技术,其主要目的就是简化数据。
它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结果。
这些假设变量是不可观测的,通常称为因子。
它们反映了原来众多的观测变量所代表的主要信息,并能解释这些观测变量之间的相互依存关系。
二、因子分析的数学模型和相关统计量二、因子分析的数学模型和相关统计量
(一)数学模型
(二)相关统计量1、因子载荷2、共同度3、因子的贡献4、巴特利特球体检验5、KMO指数三、因子分析的基本步骤三、因子分析的基本步骤1、确定研究变量。
2、计算所有变量的相关矩阵。
3、构造因子变量。
4、因子旋转。
5、计算因子得分。
四、实例分析四、实例分析某公司为了了解消费者对牛肉、色、羊肉、猪肉及鸡等五种肉类食物的偏好倾向,进行了一次市场调查。
请10位消费者对这五种肉类进行评分。
评分采用十分制,分数越高表示越喜欢。
调查结果列于下表。
试用因子分析方法研究影响消费者选择食物的因素。
RotatedComponentMatrixRotatedComponentMatrixaa.791.736-.393-.649-.211-.184.761.127.715鸡鱼牛肉猪肉羊肉12ComponentExtractionMethod:
PrincipalComponentAnalysis.RotationMethod:
VarimaxwithKaiserNormalization.Rotationconvergedin3iterations.a.上表是SPSS11.0输出的旋转后的因子载荷矩阵。
我们可以依此推断两个公共因子的含义。
从表中的数据来看,鸡、鱼、牛肉在第一公共因子的因子载荷值较高,而在第二公共因子的因子载荷值较低,故第一公共因子反映鸡、鱼、牛肉的公共特性。
第一公共因子可能代表脂肪少。
而羊肉、猪肉在第二公共因子的因子载荷值较高,在第一公共因子的因子载荷值较低,这说明第二公共因子反映羊肉、猪肉的公共特性,第二公共因子可能代表价格。
因而我们可以认为脂肪和价格是决定消费者肉类消费的主要因素。
第五节对应分析第五节对应分析一、对应分析的基本思想一、对应分析的基本思想对应分析,又称为相应分析,是在R型和Q型因子分析基础上,发展起来的一种多元相依的变量统计分析技术。
它通过分析由定性变量构成的交互汇总表来揭示变量间的关系。
当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。
二、有关统计术语与资料格式二、有关统计术语与资料格式
(一)统计术语1、列联表2、主成分3、惯量和特征值4、卡方、似然比卡方、曼图汉斯泽鲁卡方、法系数、列联系数
(二)数据格式三、分析的步骤三、分析的步骤1、确定研究的内容2、获取分析资料3、对列联表作对应分析4、解释结果意义5、评价分析结果四、实例分析四、实例分析某公司进行一次市场调查,得到轿车特征于一些用户特征的数据。
如有:
轿车大小(大、中、小)、轿车类型(家用型、跑车、商用车)、收入(一份收入、双份收入)、状态(已婚、已婚有孩子、未婚、未婚有孩子)、房子(租房、买房)等数据。
现请分析它们之间的联系。
Dimension11.51.0.50.0-.5-1.0Dimension22.01.51.0.50.0-.5-1.0-1.5NHOMENMARITNINCOMENTYPENSIZE租房买房未婚有孩子未婚已婚有孩子已婚双份收入一份收入商用车跑车家用车大型中型小型1、已婚有孩子、家用车和中型车相关性较大。
2、已婚和双份收入有联系,已婚、已婚有孩子和买房也有一定的联系。
3、未婚、一份收入和租房之间关系紧密。
4、跑车与小型车之间也有关系。
从对应图可以推断出下面一些结论:
从对应图可以推断出下面一些结论:
根据上面的结论根据上面的结论,我们在进行市场细分、制定营销战略方面可以充分利用这些信息。
例如:
面向已婚家庭应重点推销中型家用车。
而那些未婚、一份收入、租房的消费者,因其经济条件方面的原因,他们难以成为轿车消费的目标顾客群。
另外现没有适合双份收入、已婚的消费者的车型,应考虑开发新车型满足他们的需求。
第六节多维偏好分析第六节多维偏好分析一、主成分分析法简介一、主成分分析法简介
(一)主成分分析的基本思想主成分分析法就是将原来众多具有一定相关性的指标(如p个指标),重新组合成一组新的相互无关的综合指标来代替原来的指标。
(二)主成分分析的数学模型(三)主要统计术语1、偏好评分2、特征值或惯量二、分析的基本步骤二、分析的基本步骤1、确定研究的问题2、资料的收集3、主成分分析4、偏好图并解释结果意义三、实例分析三、实例分析某心理学期刊作了一项市场调查,以了解自己刊物与现有的其它心理学刊物的相对定位。
他们挑选10种心理学刊物,请39个专业心理学家根据他们对这些刊物的偏好按1-10的量表评分,其中“1”代表低评价,“10”代表高评价。
利用SPSSCategoriesPRINCALS过程的“非线性”主成分分析方法对上表的资料进行分析,部分结果如下:
这些刊物表现为以下分组:
1)一个“硬”组,包括JEXP,PMET,MVBR,JAPP,或许BULL2)一个“发展”组,包括JEDP,HUDE2、成份加载图表:
箭头指向相同的心理学家的偏好相似。
如,图形左上方的“D”组的发展和教育心理学家偏好教育心理学杂志和人类发展两种期刊。
其它组心理学家的偏好也很明显,都集中指向其研究方向的期刊。
3、双图:
4、模型总结最后结果说明,总的拟合情况好:
二维顺序方案占总方差的大约82%。
第七节多维尺度法第七节多维尺度法一、多维尺度法的基本介绍一、多维尺度法的基本介绍具体主要包括两步:
(1)初步图形结构的构造。
(2)初步图形结构的修改。
二、统计术语与数据格式二、统计术语与数据格式
(一)统计术语1、接近程度2、空间图3、克鲁斯卡系数4、残差
(二)数据格式多维尺度法输入的数据是表示待比较事物之间相似程度的矩阵。
三、分析的基本步骤三、分析的基本步骤1、确定研究的问题。
2、获取资料。
3、作多维尺度分析。
4、作空间图并解释结果意义。
5、评价分析结果。
四、实例分析:
四、实例分析:
在某次市场研究中,研究者调查了10位消费者,要求他们对A、B、C、D、E等五种品牌的相似性进行评分。
消费者利用李克量表分别对AB、AC、AD、AE、BC、BDBE、CD、CE、DE中的每一对评分。
其中一位消费者的评分结果为:
AB=2、AC=1、AD=4、AE=5BC=6、BD=8、BE=6CD=3,CE=7,DE=5,从而可以得到一个相似性比较矩阵。
请就此进行多维尺度分析。
将表的相似矩阵输入,利用SPSS11.0进行计算,可得到如下的概念空间图:
DerivedStimulusConfigurationEuclideandistancemodelDimension13210-1-2Dimension21.0.50.0-.5-1.0-1.5edcba从该空间图可以看出,D和E相对接近。
在第一维度方向,A、B、C、D、E几个品牌的差异较为明显。
第八节联合分析第八节联合分析一、联合分析的基本概念与功能一、联合分析的基本概念与功能联合分析方法的基本思想是,通过提供给消费者以不同的属性组合形成的产品,请消费者做出心理判断,按其意愿程度给产品组合打分、排序,然后采用数理分析方法对每个属性水平赋值,使评价结果与消费者的给分尽量保持一致,来分析研究消费的选择行为。
二、联合分析的模型和有关统计术语二、联合分析的模型和有关统计术语
(一)联合分析的基本模型
(二)统计术语1、分值函数2、属性和水平3、相对重要性权数4、全轮廓5、配对表6、实验设计7、内部有效性8、最大效用模型三、联合分析的基本步骤三、联合分析的基本步骤1、确定研究对象2、确定属性及水平3、实验设计4、资料的收集5、计算属性的分值6、评价分析的结果7、解释结果8、模拟市场占有率
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场 研究 中的 数据 分析 方法