欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    独立性检验的基本思想和初步应用.docx

    • 资源ID:1970796       资源大小:86.21KB        全文页数:20页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    独立性检验的基本思想和初步应用.docx

    1、独立性检验的基本思想和初步应用学习目标1.了解独立性检验的基本思想、方法及其简单应用.2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤知识点一两个分类变量之间关联关系的定性分析1分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量这里的“变量”和“值”都应作为“广义”的变量和值进行理解,它们取的不一定是具体的数值2列联表列出的两个分类变量的频数表,称为列联表假设两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd3.两个分类变量之间关联

    2、关系的定性分析的方法(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小进行比较来分析分类变量之间是否有关联关系通常通过列联表列出两个分类变量的频数表来进行分析(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互相影响,常用等高条形图展示列联表数据的频率特征知识点二独立性检验1定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验2K2,其中nabcd.3独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果kk0,就推断“X

    3、与Y有关系”,这种推断犯错误的概率不超过,否则就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”题型一有关“相关的检验”例1某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱总计男生212344女生62935总计275279解判断方法如下:假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小a21,b23,c6,d29,n79,K28.106.且P(K27.879)0.005即我们得到的K2的观测值

    4、k8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”反思与感悟(1)利用K2求出K2的观测值k的值再利用临界值的大小来判断假设是否成立(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断跟踪训练1打鼾不仅影响别人休息,而且可能与患某种疾病有关下表是一次调查所得的数据:患心脏病未患心脏病总计每一晚都打鼾30224254不打鼾241 3551 379总计541 5791 633根据独立性检验,能否在犯错误的概率不超过0.001的前提下认为每一晚都打鼾

    5、与患心脏病有关系?解由列联表中的数据,得K2的观测值k68.03310.828.因此,在犯错误的概率不超过0.001的前提下,认为每一晚都打鼾与患心脏病有关系题型二有关“无关的检验”例2为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人分析学生选报文、理科与对外语的兴趣是否有关?解列出22列联表理文总计有兴趣13873211无兴趣9852150总计236125361代入公式得K2的观测值k1.871104.1.8711042.706,可以认为学生选报文、理科

    6、与对外语的兴趣无关反思与感悟运用独立性检验的方法:(1)列出22列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论跟踪训练2在一次恶劣天气的飞行航程中调查男女乘客在飞机上晕机的情况如下表所示,根据此资料是否能在犯错误的概率不超过0.05的前提下认为在恶劣天气飞行中男人比女人更容易晕机?晕机不晕机总计男人243155女人82634总计325789解根据列联表中的数据,可得K2的观测值为k3.689.P(K23.841)0.05,且3.6893.841.所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”反思与感悟(1)解答此类题目的关键在于正确利用K2计算k的值,

    7、再用它与临界值k0的大小作比较来判断假设检验是否成立,从而使问题得到解决(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握跟踪训练3某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?物理优秀化学优秀总分优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人解列出数学成绩与物理成绩的22列联表如下:物理优秀物理非优秀合计数学优秀22813

    8、2360数学非优秀143737880合计3718691 240将表中数据代入公式,得K的观测值为k1270.110.828.列出数学成绩与化学成绩的22列联表如下:化学优秀化学非优秀合计数学优秀225135360数学非优秀156724880合计3818591 240将表中数据代入公式,得K的观测值为k2240.610.828.列出数学成绩与总分成绩的22列联表如下:总分优秀总分非优秀合计数学优秀26793360数学非优秀99781880合计3668741 240将表中数据代入公式,得K的观测值为k3486.110.828.由上面的分析知,K2的观测值都大于10.828,说明在犯错误的概率不超过

    9、0.001的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系求K2时用错公式致误例4在109个人身上试验某种药物预防感冒的作用,得到如下列联表:感冒未感冒总计服用药114657未服用药213152总计3277109则有多大把握认为该药有效?错解k0.313 85.024,在犯错误的概率不超过0.025的前提下认为该药物有效点评要理解公式的推导过程,掌握公式中每个量的意义,抓住公式的特征,就会避免用错公式1观察下列各图,其中两个分类变量x,y之间关系最强的是()答案D解析观察等高条形图发现和相差越大,就判断两个分类变量之量关系越强2下面是一个22列联表:y1y2总计x1a2173x282

    10、533总计b46106则表中a,b处的值分别为()A94,96 B52,50C52,60 D54,52答案C解析a2173,a52,ba852860.3某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下22列联表:偏爱蔬菜偏爱肉类总计50岁以下481250岁以上16218总计201030则可以说其亲属的饮食习惯与年龄有关的把握为()A90% B95%C99% D99.9%答案C解析因为K2的观测值k106.635,所以有99%的把握认为其亲属的饮食习惯与年龄有关4为了判断高中学生的文理科选修是否与性别有关系,随机调查了50名学生,得到如下22列联表:理科文科男1310女720已知

    11、P(K23.841)0.05,P(K25.024)0.025.根据表中数据,得到K2的观测值k4.844.可认为选修文科与性别有关系的可能性不低于_答案95%解析K2的观测值k4.8443.841,且P(K23.841)0.05,这表明在犯错误的概率不超过0.05的前提下认为选修文科与性别之间有关系,即选修文科与性别有关系的可能性不低于95%.5根据下表计算:不看电视看电视男3785女35143K2的观测值k_(保留3位小数)答案4.514解析k4.514.1列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,

    12、进而推断它们之间是否具有关联关系2对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理K2越大,两个分类变量有关系的可能性越大一、选择题1对两个分类变量A,B的下列说法中正确的个数为()A与B无关,即A与B互不影响;A与B关系越密切,则K2的值就越大;K2的大小是判定A与B是否相关的唯一依据A0 B1 C2 D3答案B解析正确,A与B无关即A与B相互独立;不正确,K2的值的大小只是用来检验A与B是否相互独立;不正确,例如借助三维柱形图、二维条形图等故选B.2在等高条形图中,下列哪两个比值相差越大,

    13、要推断的论述成立的可能性就越大()A.与 B.与C.与 D.与答案C解析由等高条形图可知与的值相差越大,|adbc|就越大,相关性就越强3高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:优秀及格总计甲班113445乙班83745总计197190则随机变量K2的观测值约为()A0.600 B0.828C2.712 D6.004答案A解析根据列联表中的数据,可得随机变量K2的观测值k0.600.故选A.4.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:使用智能手机不使用智能手机合计学习成绩优秀4812学习成绩不优秀16218合计

    14、201030附表:P(K2k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828经计算K210,则下列选项正确的是()A.有99.5%的把握认为使用智能手机对学习有影响B.有99.5%的把握认为使用智能手机对学习无影响C.有99.9%的把握认为使用智能手机对学习有影响D.有99.9%的把握认为使用智能手机对学习无影响答案A解析依题意,注意到7.879K210.828,因此有99.5%的把握认为使用智能手机对学习有影响,选A.5考察棉花种子经过处理跟生病之间的关系得到下表数据:种子处理种子未处理总计得病3

    15、2101133不得病61213274总计93314407根据以上数据,可得出()A种子是否经过处理跟是否生病有关B种子是否经过处理跟是否生病无关C种子是否经过处理决定是否生病D以上都是错误的答案B解析由K20.164k2k3k1,所以阅读量与性别有关联的可能性最大二、填空题82013年6月11日,中国的“神舟十号”发射成功,由此许多人认为中国进入了航天强国之列,也有许多人持反对意见,为此进行了调查在参加调查的3 648名男性公民与3 432名女性公民中,持反对意见的男性有1 843人、女性有1 672人,在运用这些数据说明中国“神十”发射成功是否与中国进入航天强国有关系时,用下列_最具说服力回

    16、归直线方程;平均数与方差;独立性检验答案解析由于参加调查的公民按性别被分成两组,而且每一组又被分成两种情况:认为有关与无关故该资料取自完全随机统计,符合22列联表的要求,应用独立性检验最具说服力9在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填“有关”或“无关)答案有关解析由K2观测值k27.63与临界值比较,我们有99.9%的把握说打鼾与患心脏病有关10下表是关于男婴与女婴出生时间调查的列联表:晚上白天总计男婴45AB女婴E35C总计98D180那么,A_,B_,C_,D_,E_.答案4792888

    17、253解析由列联表知识得解得11在研究性别与吃零食这两个分类变量是否有关系时,下列说法中正确的是_若K2的观测值k6.635,则我们在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,如果某人吃零食,那么此人是女性的可能性为99%;由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误答案解析K2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知

    18、在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填.三、解答题12随着生活水平的提高,人们的休闲方式也发生了变化某机构随机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动(1)完成下列22列联表:运动非运动总计男生女性总计n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?解(1)补全22列联表如下:运动非运动总计男性nnn女性nnn总计nnn

    19、(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,则P(K2k0)3.841.由于K2的观测值k,故3.841,即n138.276.又由nZ,故n140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人(3)根据(2)的结论,本次被调查的人中,至少有14056(人)的休闲方式是运动13某学校为了解该校高三年级学生在市一练考试的数学成绩情况,随机从该校高三文科与理科各抽取50名学生的数学成绩,作出频率分布直方图如图,规定考试成绩在120,150内为优秀(1)由以上频率分布直方图填写下列22列联表若按是否优秀来判断,是

    20、否有99%的把握认为该校的文理科数学成绩有差异.文科理科总计优秀非优秀总计5050100(2)某高校派出2名教授对该校随机抽取的学生成绩中一练数学成绩在140分以上的学生进行自主招生面试,每位教授至少面试一人,每位学生只能被一位教授面试若甲教授面试的学生人数为,求的分布列和均值解(1)由频率分布直方图知,该校文科学生中数学成绩优秀的人数为(0.0100.0040.002)10508,故非优秀人数为50842.该校理科学生中数学成绩优秀的人数为(0.0200.0140.006)105020,故非优秀人数为502030.则22列联表如下:文科理科总计优秀82028非优秀423072总计5050100K2的观测值k7.1436.635,故有99%的把握认为该校文理科数学成绩有差异(2)由(1)知,该校随机抽取的学生成绩中一练数学成绩在140分以上的学生为4人,的可能取值为1,2,3.将4人分给两名教授每名教授至少1名学生的不同分法种数为A14,则P(1),P(2),P(3).的分布列为123PE()1232.


    注意事项

    本文(独立性检验的基本思想和初步应用.docx)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开