欢迎来到冰点文库! | 帮助中心 分享价值,成长自我!
冰点文库
全部分类
  • 临时分类>
  • IT计算机>
  • 经管营销>
  • 医药卫生>
  • 自然科学>
  • 农林牧渔>
  • 人文社科>
  • 工程科技>
  • PPT模板>
  • 求职职场>
  • 解决方案>
  • 总结汇报>
  • ImageVerifierCode 换一换
    首页 冰点文库 > 资源分类 > PDF文档下载
    分享到微信 分享到微博 分享到QQ空间

    stata中文教程-入门经典资料下载.pdf

    • 资源ID:5967441       资源大小:14.76MB        全文页数:77页
    • 资源格式: PDF        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录
    二维码
    微信扫一扫登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    stata中文教程-入门经典资料下载.pdf

    1、a:3:i:0;s:17190:第 29 卷第 1 期2015 年 2 月保险职业学院学报(双月刊)JOUNAL OF INSUANCE POFESSIONAL COLLEGE(Bimonthly)Vol.29No.1Feb 2015论大数据对中国保险业的影响尹会岩(中国人民财产保险股份有限公司沈阳监察稽核中心,辽宁 沈阳 110031)摘要 随着互联网金融的破冰,金融行业认识到互联网的聚众效应,随着大数据时代的来临,保险行业又该做些什么呢?#大数据影响着保险行业的营销、管理、研发工,保险行业在大数据时代的影响下,采取了各种路径来尝试通过大数据及相关技术来促进业务发展,最终实现保险服务社会的目

    2、标。#文中列举出保险行业中部分经营主体对广告营销、产品开发、承保定价、保险理赔、客户服务的创新,对于保险行业正确对待大数据有一定的借鉴作用。#关键词 保险;#大数据;#数据挖掘;#互联网 中图分类号 F840 文献标识码 A 文章编号 1673 1360(2015)01 0043 04 AbstractWith the icebreaking of the Internet finance,the financial industry comes to recognize the mag-neticeffect of the Internet With the coming of the bi

    3、g data era,what should the insurance industry do?#Big dataaffects the marketing,management,research and development of the insurance industry The insurance industryhas tried various paths to promote business development through the data and relevant technology to serve the so-ciety This article list

    4、s some insurance companiesinnovation practice in advertising and marketing,product de-velopment,pricing,underwriting and claiming settlement,customer service,which will provide some referencesfor the insurance industry to deal with big data correctly Key wordsInsurance;#Big Data;#Data Mining;#Intern

    5、et随着云计算、物联网、大数据等新技术不断的涌现,保险行业开始意识到大数据及 IT 技术变革带来的机遇。#随着社交网络的成熟,移动网络带宽的提升,云计算应用的丰富,更多传感器、移动设备、智能终端接入到网络,物联网的迅速发展,由此产生的数据将呈现爆炸式增长。#而在这种技术趋势下,拥有大量原始数据金矿的保险行业,由于采取谨慎的态度,发展一直很缓慢,因此,保险公司的积极应对与转型,已经成为一个既关键又迫切的问题。#一、背景据 中国互联网络发展状况统计报告 显示,截至 2013 年 12 月,中国网民规模达 6 18 亿,手机网民规模达 5 亿,互联网普及率为 45 8%,火山喷发式增长的各种国家、公

    6、司业务性的结构化数据,社交、搜索、公共监管等非结构化数据,分析和应用这些数据的可视化技术,及带来的思维模式的变革,把人们带入了全新的大数据时代。#而保险的核心基础是大数法则,数据分析与计算决定了保险企业产品的定价能力,所以对大数据分析和掌控能力对保险行业意义更为重大。#大数据带来更多的跨界融合,更多的商机,更容易产生颠覆性创新,可以说大数据不仅仅是一种数据资源、一种 IT 技术,更是一种应用工具、一种发展趋势。#二、大数据影响保险业的主要环节保险天然就具有大数据的特征,一是保险行业是经营风险的行业,要利用风险模型或数理技术等对标的物的风险进行评定;#二是保险公司的利润主作者简介:#尹会岩(19

    7、79 ),男,回族,辽宁营口人,中级经济师,硕士研究生,现就职于中国人民财产保险股份有限公司沈阳监察稽核中心,研究方向:#保险、审计。#保险职业学院学报(双月刊)2015 年第 1 期要来源于收取的保费和未来的赔付支出的差额,保险公司先要对这些风险发生的概率进行预测,而大数据的一个关键核心就是预测;#三是保险经营的每个过程都和大数据密不可分。#业务系统中的保单数据及保单维持数据及核保理赔数据,保费投资经营的投资理财数据,精算部门定价数据,各类风险管理数据,财务乃至宏观管理数据。#从信息量来看,保险行业的大数据时代早已经提前到来。#随着信息技术的发展,保险公司每时每刻都要积累着大量的数据信息,数

    8、据量的级别呈现爆炸式的增长。#目前,保险行业在大数据战略和网络经营等方面进行了积极的探索,2013 年有 60 多家保险公司开展了网上保险业务,人保集团建设完成了企业私有云计算平台,并准备开展车联网的试点。#平安与百度联手研究车险用户基于互联网的行为模式。#泰康人寿利用微博搜索引擎、社交网站等途径优化品牌管理,加强客户关系等。#从当前情况看,大数据对保险行业的影响主要表现在以下几个环节上:#(一)广告营销大数据概念出现之前,广告宣传手段主要是通过传统媒体如电视、广告牌等等,每个用户看到的广告都是一样的,若该用户没有相关需求,此条广告就没有产生效果。#现在随着大数据及网络的发展和进步,营销方面产

    9、生很多数据洞察相关的挖掘,通过一种可测量的技术判断目标客户,从而分析锁定对应的客户,进行针对性的营销,为企业节约了投放成本。#大数据时代的广告营销,不是用同一个广告及营销手段针对所有群体,而是采用针对细分的群体进行宣导营销。#如采用行为的数据,意图的数据,情绪的数据等等进行细分,并且可以区分用户是曾经关注过该类产品或是偶然点击,确定什么样的时段更合适等等。#保险行业可以通过精准营销来寻找有保险需求的目标客户,并开展针对性的营销手段,根据客户需求推送相关保险产品,而不是采用扰民的信息群发推广方式,避免客户产生反感,从而对保险产生抵触情绪。#平安财险公司在大数据应用上进行了多年的尝试。#通过从客户

    10、搜索轨迹分析客户的需求,并勾勒出数据背后人的特征,不仅仅在消费者直接搜索“车险”的时候进行品牌沟通与宣传,而是突破了只关注车主与保险的局限性,以一个产业链来深入了解车主的需求,全方位了解与车相关的消费生活,与车主建立沟通,收到良好的效果。#目前,除了通过主动的搜索会了解客户外,微信的应用也爆发式地增长。#通过微信的关注,我们能够了解客户的爱好,对应于爱好可以适当地进行产品营销,将是未来一段时间内的发展趋势。#(二)产品开发保险产品开发是指保险公司基于自身发展和保险市场需求而创新产品或对现有产品进行改良、组合,以适应市场需要、提高自身竞争力的过程或行为。#产品设计主要以客户需求为基础。#对于财产

    11、保险而言,主要满足客户规避各种可保风险所致的财产及相关利益损失等方面的需求;#对于人身保险而言,各种产品主要是满足客户保障、养老、健康、伤残等方面的需求。#保险产品的价值是能够通过经济补偿与保险金给付提供财务保障。#保险产品的开发是保险经营活动中的重要内容,它对于增强保险公司的竞争力、增力保险公司的收益、满足保险消费者的需求方面都具有重要的意义,也是保险公司其他经营活动的前提,是保险经营活动的起点,保险是以风险的承保为经营对象的业务,但是并不是所有的风险都能够作为可保风险,这就需要在保险产品开发的过程中确定可保风险、保险标的、保险金额、保险责任、保险期限等。#保险产品的开发是保险公司争夺更多的

    12、市场份额,提高经济效益的重要手段。#保险产品的开发客观上推动了保险公司精算能力和风险管理能力的提高,可以更好地满足人们的保险需求,而产品开发主要是基于承保标的风险已知的相关数据来预测损失情况,目前保险行业的产品开发主要以积累的大规模数据,对客户进行细分,当数量足够多时,就可以开发针对不同群体客户的具体产品,而如果数据量足够大时,甚至可以提供针对个人的满足其需求的产品。#(三)承保定价随着互联网的普及,汽车数字化也已成为发展趋势。#在互联网及 IT 技术盛行的时代,汽车必将成为能移动的互联网计算机。#汽车数字化将实现442015 年第 1 期(总第 158 期)尹会岩:#论大数据对中国保险业的影

    13、响自动驾驶、汽车的自我状态检测、自动导航等功能,并将各类信息进行数字化包括维修、驾驶路线、事故录像、关键部件的状态,甚至驾驶习惯(如刹车和加速)都将记录存储以便与分析利用。#在保护隐私的前提下,一旦数字化汽车产生的大数据通过互联网存储和分享,势必引发车险商业模式的重构。#保险公司通过数据分析,可以掌握客户车辆主要用途、基本行车路线、路途的风险程度、驾驶习惯、事故发生频率等信息,还可以掌握客户车辆的使用状况,如是否定期保养、胎压是否保持正常、刹车是否符合标准等信息。#有了这些信息,保险公司就可测评出该客户车辆的风险指数,从而实现对该客户车险费率的“私人定制”。#在大数据的支持下,保险公司可以真正

    14、以客户为中心,把客户分为成千上万种,每个客户都有个性化的解决方案,这样保险公司经营就完全可以实现差别费率,对于风险低的客户敢于大胆降低费率,对于风险高的客户提高费率甚至拒绝承保,这样保险公司之间就可以实现真正的差异化竞争。#而拥有大数据技术并能利用大数据的保险公司将拥有压倒性的竞争优势,大数据的运用能力将成为保险公司最核心的竞争力。#保险就是基于风险概率评估,大数据是准确评估风险概率最有利的工具。#大数据时代的来临,保险经营更多的依靠数据支持,不断进行风险细化,不久的将来完全可能通过个人的公共数据情况、信息体系、社交网络、健康数据、性格等信息,得出个人的风险情况,投保时实现以人为别的承保定价。

    15、#(四)保险索赔在大数据时代,保险公司通过公共信息实时获得客户的出险信息,并及时主动联系保险客户提供理赔等服务。#如某客户在高速公路上驾车出险,该客户向交警报案,保险公司就能够及时获得报案信息,在客户没有向保险公司提出理赔申请之前,主动向客户提供理赔服务;#保险公司通过与修理行业的合作获取每辆汽车的维修、保养情况,查勘时查勘员很容易判断是否为旧伤部位出险,并对该受损进行比例赔付,避免客户从保险中不当得利。#除了提高保险索赔的准确性与及时性,更主要的是防止保险欺诈。#目前,保险公司主要依靠一些固定标准和理赔人员的经验,来判断是否存在保险欺诈。#由于缺乏行业内协作机制和共享的信息平台,调查的质量主

    16、要依赖于理赔人员的个人素质以及公安机关的合作情况。#许多大案是凭借理赔人员的经验和责任心,以及公安机关的介入,才能取得相关证据。#然而,经验无法复制,并且在面对大量新型保险欺诈时,保险公司及理赔部门难免捉襟见肘、疲于应付。#而从本质上看,欺诈是由于双方信息不对称所导致的,大数据能够弱化部分不对称的信息,从而避免保险公司赔付成本上升,间接降低所有投保人获取保单的成本,保障了所有投保人的正当权益。#随着各部门的合作和经验的积累,在数据完善积累的基础上循序渐进,从特征分析、因子分析和网络分析入手,建立高效的反欺诈鉴别机制,也许只是时间问题。#(五)客户服务在大数据时代,保险行业可以实时捕捉客户的保险

    17、需求,并对保险需求进行客户群细分,从而掌握到哪些客户具有保险需求,有保险需求的客户需要哪种保险产品,从中找到潜在客户群及具体需要的保险产品,最终由相应销售渠道或销售人员进行推荐介绍。#大数据技术将提高保险行业竞争力,降低销售误导,重塑保险行业守信用、担风险、重服务的形象。#友邦保险 3 年前已经开始做客户细分的工作,通过 20 年积累的客户数据,用科学的方法细分客户需求,改进产品设计和服务质量。#开通了网上服务自助平台及微信服务平台,开发“客户地图”等系统工具,帮助销售人员科学管理和分析客户在不同人生阶段的保障、理财需求,试验的 O2O模式,已经初见成效,线上的精准定位和前期需求挖掘,与线下高

    18、效的销售流程相结合,有效提升了客户体验,也为企业创造了价值。#大数据时代给保险企业真正了解客户的机会,基于大数据技术的客户需求获取、客户需求体验、客户满意度的调查等等与客户的交互,均可以采用“全量”方式,并且创新交互维度和视角。#当保险行业全面掌握客户的需求后,推出客户需求的保险54保险职业学院学报(双月刊)2015 年第 1 期产品,以客户接受的方式,推荐给客户,解决客户与保险主体之间的信息不对称导致的销售误导,解决了客户体验问题,保险行业也在满足客户的同时,实现销售的最大化与社会价值的最大化。#三、保险行业的展望对于保险行业来说,大数据时代既是机遇,也是挑战,保险行业需要不断改革和创新。#

    19、只有改变旧思维、打破旧模式,进行行业再造,才能实现凤凰涅槃。#要以“数据为生、客户为先、服务为王”的宗旨,满足客户需求,提升客户服务手段,为保险行业带来新的发展。#一是保险行业服务理念更加清晰。#未来保险行业的服务理念,就是以客户为中心,满足客户的需求、注重客户服务体验,通过大数据的挖掘与分析,了解客户、服务客户,以服务赢得客户的信赖,用最高的费效比提供最佳的客户体验度和满意度。#二是保险行业的经营模式更先进。#在云计算、商业智能、数据挖掘等技术支撑下,充分利用大数据,实现精准营销,精确捕捉客户需求,完成产品销售,并提供优质服务,并通过服务流程的再造,不断提升客户体验度和满意度,推动客户通过社

    20、交网络与熟人圈子传递公司优质服务的讯息,使口碑向外层层扩散,争取赢得更多的潜在客户。#在大数据时代挑战与机遇并存,大数据时代并不只是数字和算法,计算机依然无法完全替代人的作用。#大数据为我们决策提供参考,而不是最终结果,更好的解决方案永远在不久的将来。#大数据时代是保险行业实践中国梦的良机,它将使保险销售和保险消费都回归经营本原,通过风险评估计算的最大化来增加保险深度与广度,最终促进保险市场繁荣、稳定;#通过保险供给与保险需求和谐统一,最终使保险行业取信于民、保障于民;#通过消除销售误导等不和谐因素,最终让保险发挥社会稳定器和经济助推器的作用;#同时保险企业必须具备相应的风险控制能力,防止大数

    21、据带来的风险,避免在瞬间赔掉过去几十年的积累。#参考文献 1维克托迈尔舍恩伯格 大数据时代:#生活、工作与思维的大变革M 周涛,译 杭州:#浙江人民出版社,2012 2王薇 大数据时代将在本质上挑战保险业 J 中国保险报,2013,(03):#8 9 3王薇 车险客户细分需依赖大数据J 中国保险报,2014,(02):#8 9 4王薇 保险:#谁拥有数据谁拥有未来 J 中国保险报,2011,(08):#7 8 5张宁,郭楠 大数据背景下的寿险产品定价与创新研究 J 海南金融,2014,(01):#53 57 6邬贺铨 大数据时代的机遇与挑战J 求是,2013,(04):#47 49 7姚奕 大

    22、数据:#让保险欺诈无所遁形 J 中国保险报,2013,(06):#7 8 8高嵩 首个大数据客户体验报告出炉J 中国保险报,2014,(03):#2 3 9尹会岩等 解读平安财险的大数据营销 J 中国金融电脑,2014,(04):#73 75 10张紫 第 33 次中国互联网发展状况统计报告 J 计算机与网络,2014,(01):#5 5 11张则鸣 浅谈大数据与保险业的未来 J 上海保险,2014,(02):#21 26(责任编辑:#何厚发)64;i:1;s:10700:SPSSSPSS 操作:#二分类操作:#二分类 LogisticLogistic 回归回归 作者:#张耀文作者:#张耀文

    23、1 1、问题与数据、问题与数据 某呼吸内科医生拟探讨吸烟与肺癌发生之间的关系,开展了一项成组设计的病例对照研究。#选择该科室内肺癌患者为病例组,选择医院内其它科室的非肺癌患者为对照组。#通过查阅病历、问卷调查的方式收集了病例组和对照组的以下信息:#性别、年龄、BMI、COPD 病史和是否吸烟。#变量的赋值和部分原始数据见表 1和表 2。#该医生应该如何分析?#表 1.肺癌危险因素分析研究的变量与赋值 因素 变量名 赋值说明 研究对象编号 ID 性别 gender 男=1,女=0 年龄 age BMI BMI BMI25=0;#BMI25=1 COPD 病史 COPD 无=0;#轻/中度=1;#

    24、重度=2 吸烟 smoke 无=0;#曾吸/现吸=1 肺癌 cancer 对照=0;#病例=1 表 2.部分原始数据 ID gender age BMI COPD smoke cancer 1 0 34 0 1 1 0 2 1 32 0 1 0 1 3 0 27 0 1 1 1 4 1 28 0 1 1 0 5 1 29 0 1 0 0 6 0 60 0 2 0 0 7 1 29 0 0 1 1 8 1 29 1 1 1 1 9 1 37 0 1 0 0 10 0 17 0 0 0 0 11 0 20 0 0 1 1 12 1 35 0 0 0 0 13 0 17 1 0 1 1 2 2、对数

    25、据结构的分析、对数据结构的分析 该设计中,因变量为二分类,自变量(病例对照研究中称为暴露因素)有二分类变量(性别、BMI 和是否吸烟)、连续变量(年龄)和有序多分类变量(COPD病史)。#要探讨二分类因变量与自变量之间的关系,应采用二分类二分类 Logistic 回归回归模型模型进行分析。#在进行在进行二分类二分类 Logistic 回归回归(包括其它(包括其它 Logistic 回归回归)分析分析前前,如果样本不如果样本不多而变量较多,多而变量较多,建议先通过单变量分析(建议先通过单变量分析(t 检验检验、卡方检验等卡方检验等)考察所有自变量)考察所有自变量与因变量之间的关系,与因变量之间的

    26、关系,筛掉一些可能无意义的变量,筛掉一些可能无意义的变量,再再进行多因素分析,这样进行多因素分析,这样可以保证结果更加可靠。#即使样本足够大,也不建议直接把所有的变量放入方可以保证结果更加可靠。#即使样本足够大,也不建议直接把所有的变量放入方程直接分析,一定要先弄清楚各个变量之间的相互关系,程直接分析,一定要先弄清楚各个变量之间的相互关系,确定确定自变量进入方程自变量进入方程的形式,这样才能有效的进行分析。#的形式,这样才能有效的进行分析。#本例中单变量分析的结果见表 3(常作为研究报告或论文中的表 1)。#表 3.病例组和对照组暴露因素的单因素比较 病例组(病例组(n=85)对照组对照组(n

    27、=259)2/t 统计量统计量 P 性别,男(%)56(65.9)126(48.6)7.629 0.01 年龄(岁),x s 40.3 14.0 38.6 12.4 1.081 0.28 BMI,n(%)正常 48(56.5)137(52.9)0.329 0.57 超重或肥胖 37(43.5)122(47.1)COPD 病史,n(%)无 21(24.7)114(44.0)14.123 0.01 轻中度 24(28.2)75(29.0)重度 40(47.1)70(27.0)是否吸烟,n(%)否 18(21.2)106(40.9)10.829 0.01 是 67(78.8)153(59.1)单因素

    28、分析中,病例组和对照组之间的差异有统计学意义的自变量包括:#性别、COPD 病史和是否吸烟。#此时,应当考虑应该将哪些此时,应当考虑应该将哪些自变量自变量纳入纳入 Logistic 回归回归模型。#一般情况下,建模型。#一般情况下,建议议纳入的变量有:#纳入的变量有:#1)单因素分析单因素分析差异差异有统计学有统计学意义的变量意义的变量(此时,此时,最好将最好将 P 值值放宽一些,比如放宽一些,比如 0.1 或或 0.15 等等,避免漏掉一些重要因素避免漏掉一些重要因素);#2)单因素分析时,单因素分析时,没有发现差异有统计学意义,但是没有发现差异有统计学意义,但是临床临床上上认为认为与因变量

    29、关系密切的自变量与因变量关系密切的自变量。#本研究中,年龄和 BMI 与因变量没有统计学关联。#但是,临床认为年龄也是肺癌发生的可能危险因素,因此 Logistic 回归模型中,纳入以下自变量:#性别、年龄、COPD 病史和是否吸烟。#此外此外,对于连续变量,如果仅仅是为了调整该变量带来的混杂(不关心该变,对于连续变量,如果仅仅是为了调整该变量带来的混杂(不关心该变量的量的 OR 值),则可以直接将值),则可以直接将改改变量纳入变量纳入 Logistic 回归回归模型;#如果关心该变量对模型;#如果关心该变量对因变量的影响程度(关心该变量的因变量的影响程度(关心该变量的 OR 值),一般不直接

    30、将该连续变量纳值),一般不直接将该连续变量纳入模型入模型,而是将连续变量转化为而是将连续变量转化为有序多分类有序多分类变量后纳入模型。#变量后纳入模型。#这是因为,在 Logistic 回归中直接纳入连续变量,那么对于该变量的 OR 值的意义为:#该变量每升高一个单位,发生结局事件的风险变化(比如年龄每增加 1 岁,患肺癌的风险增加 1.02倍)。#这种解释在临床上大多数是没有意义的。#3 3、SPSSSPSS 分析方法分析方法 (1)数据录入 SPSS (2)选择 AnalyzeRegressionBinary Logistic (3)选项设置 1)主对话框设置:#将因变量 cancer 送

    31、入 Dependent 框中,将纳入模型的自变量 sex,age,BMI 和 COPD 变量 Covariates 中。#本研究中,纳入 age 变量仅仅是为了调整该变量带来的混杂(不关心该变量的 OR 值),因此将 age 直接将改变量纳入 Logistic 回归模型。#对于自变量筛选的方法(Method 对话框),SPSS 提供了 7 种选择,使用各种方法的结果略有不同,读者可相互印证。#各种方法之间的差别在于变量筛选方法不同,其中 Forward:#LR 法(基于最大似然估计的向前逐步回归法)的结果相对可靠,但最终模型的选择还需要获得专业理论的支持。#2)Categorical 设置:#

    32、该选项可将多分类变量(包括有序多分类和无序多分类)变换成哑变量,指定某一分类为参照。#本研究中,COPD 是多分类变量,我们指定“无 COPD 病史”的研究对象为参照组,分别比较“轻/中度”和“重度”组相对于参照组患肺癌的风险变化。#点击 Categorical将左侧 Covariates 中的 COPD 变量送入右侧 Categorical Covariates 中。#点击 Contrast 右侧下拉菜单,选择 Indicator(该下拉菜单内的选项是几种与参照比较的方式,Indicator 方式最常用,其比较方法为:#方式最常用,其比较方法为:#第一类或第一类或最后一类为参照类最后一类为参

    33、照类,每一类与参照类比较,每一类与参照类比较)。#在 Reference Category 的右侧选择 First(表示选择变量 COPD 中,赋值最小的,即“0”作为参照。#如果选择 Last 则表示以赋值最大的作为参照)点击Change点击 Continue。#3)Options 设置中,勾选如下选项及其意义:#Hosmer-Lemeshow goodness-of-fit:#检验模型的拟合优度;#CI for exp(B):#结果给出 OR 值的 95%可信区间;#DisplayAt last step:#仅展示变量筛选的最后一步结果。#Continue回到主界面OK 4 4、结果解读、

    34、结果解读 Logistic 回归的结果给出了很多表格,我们仅需要重点关注三个表格。#(1)Omnibus Tests of Model Coefficients:#模型系数的综合检验。#其中 Model一行输出了 Logistic 回归模型中所有参数是否均为 0 的似然比检验结果。#P0.05),认为当前数据中的信息已经被充分提取,模型拟合优度较高。#(3)Variables in the Equation:#1)由于本次统计过程中筛选变量的方式是 Forward:#LR 法,因此Variables in the Equation 表格中列出了最终筛选进入模型的变量和其参数。#其中 Sig.一

    35、列表示相应变量在模型中的 P 值,Exp(B)和 95%CI for EXP(B)表示相应变量的 OR 值和其 95%可信区间。#对于 sex,smoke 这两个二分类变量,OR 值的含义为:#相对于赋值较低的研究对象(sex 赋值为“0”的为女性;#smoke 赋值为“0”的为不吸烟),赋值较高的研究对象(男性、吸烟者)发生肺癌的风险为是多少(2.308 倍、3.446 倍)。#2)对于多分类变量 COPD,设置中以“0”组作为参照,则得到的结果是“1”组、“2”组分别对应于“0”组的 OR 值。#在在 Logistic 回归中回归中,设置过哑变量的设置过哑变量的多分类变量是同进同出的多分类

    36、变量是同进同出的,即只要有即只要有一组相对于参照组的一组相对于参照组的 OR 值值有统计学意义,有统计学意义,则该变量则该变量的的全部分组均全部分组均纳入模型。#纳入模型。#COPD 变量的第一行没有 OR 值,其 P 值代表该变量总体检验的差异有统计学意义(即至少有一组相对于参照组的 OR 值有统计学意义)。#3)本研究中的 COPD 变量以“0”组作为参照,因此 COPD(1)行的参数中给出了“1”相对于“0”组的 OR 值和 P 值,而在 COPD(2)行的参数中给出了“2”组相对于“0”组的 OR 值和 P 值。#4)Constant 为回归方程的截距,在模型中一般没有实际意义,大家可

    37、不必关注。#5 5、撰写结论、撰写结论 本研究发现,85 例肺癌患者中,吸烟者 67 例(78.8%);#259 例非肺癌患者中,吸烟者 153 例(59.1%),肺癌患者和非肺癌患者中的吸烟率的差异有统计学意义(2=10.829,P0.01)。#Logistic 回归模型在调整了性别和 COPD 病史后,吸烟者相对于不吸烟者,发生肺癌的风险增加(OR=3.45,95%CI:#1.86-6.40)。#多变量分析的结果见表 4(常作为研究报告或论文中的表 2)。#表 4.肺癌危险因素的 Logistic 回归分析 OR(95%CI)P 值 性别 女 1.00 男 2.31(1.34-3.97)0.01 COPD 病史 无 1.00 轻/中度 1.58(0.81-3.10)重度 3.60(1.90-6.82)0.01 吸烟 无 1.00 有 3.45(1.86-6.40)0.01 更多统计学教程,可关注“医咖会”微信公众号。#;i:2;s:0:;


    注意事项

    本文(stata中文教程-入门经典资料下载.pdf)为本站会员主动上传,冰点文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰点文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2023 冰点文库 网站版权所有

    经营许可证编号:鄂ICP备19020893号-2


    收起
    展开