高级统计学.ppt

上传人:p** 文档编号:187245 上传时间:2023-04-06 格式:PPT 页数:99 大小:1.34MB
下载 相关 举报
高级统计学.ppt_第1页
第1页 / 共99页
高级统计学.ppt_第2页
第2页 / 共99页
高级统计学.ppt_第3页
第3页 / 共99页
高级统计学.ppt_第4页
第4页 / 共99页
高级统计学.ppt_第5页
第5页 / 共99页
高级统计学.ppt_第6页
第6页 / 共99页
高级统计学.ppt_第7页
第7页 / 共99页
高级统计学.ppt_第8页
第8页 / 共99页
高级统计学.ppt_第9页
第9页 / 共99页
高级统计学.ppt_第10页
第10页 / 共99页
亲,该文档总共99页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《高级统计学.ppt》由会员分享,可在线阅读,更多相关《高级统计学.ppt(99页珍藏版)》请在第壹文秘上搜索。

1、定性数据的建模定性数据的建模列联表及列联表分析对数线性模型的基本理论和方法对数线性模型的SPSS实现 Logistic回归基本理论和方法 Logistic回归步骤以及SPSS实现 1 2 3 4 5列联表及列联表分析列联表及列联表分析研究两个属性变量之间是否有联系研究步骤: 通过问卷调查或统计资料获得属性 变量的信息 整理问卷或统计资料获得列联表数据 通过统计假设检验两个属性变量是 否具有独立性女性人口学研究女性人口学研究教育教育婚姻婚姻合计合计合计合计大学大学大学以下大学以下结婚一次结婚一次结婚多次结婚多次5506168114461182512312051436频数列联表频数列联表1AAB合

2、计合计合计合计2A3A1B2B11n12n22n21n32n31n2n1n2n1n3nn事件事件 发生的概率发生的概率A事件事件 与与 同同时发生的概率时发生的概率频率列联表频率列联表1A1B1A1AB合计合计合计合计2A3A1B2B11p12p22p21p32p31p2p1p2p1p3p1事件事件 发生的概率发生的概率1B统计假设与检验统计假设与检验零假设:属性变量A与B相互独立检验统计量及其分布: n足够大 决策规则:对给定的显著性水平 , 若 则拒绝零假设. IiJjjijiijpppppn1122)( )1)(1(2 JI )1)(1(22 JI )1)(1(2 JI 检验统计量的计算

3、检验统计量的计算IiJjjijiijIiJjjijiijnnnnnnnpppppn1121122)()(1436825205)1436825205144(14368251231)14368251231681(1436611205)143661120561(14366111231)14366111231550(2222零假设:婚姻状态与教育水平没有关系检验统计量及其分布: n足够大 决策规则:对给定的显著性水平0.05 则拒绝零假设,即婚姻状态与教育水平有关联. 84. 3) 1 (01.16205. 0201.16)(212122ijjijiijnnnnnnnSPSS实现(列联表数据结构)实现

4、(列联表数据结构)education * marriedstat Crosstabulationeducation * marriedstat CrosstabulationCount55061611681144825123120514361.002.00educationTotal1.002.00marriedstatTotalChi-Square TestsChi-Square Tests16.010b1.00015.4051.00016.5461.000.000.00015.9991.0001436Pearson Chi-SquareContinuity CorrectionaLikel

5、ihood RatioFishers Exact TestLinear-by-LinearAssociationN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is 87.22.b. SPSS实现实现Gender * Employment Category Crosstab

6、ulationGender * Employment Category CrosstabulationCount20601021615727742583632784474FemaleMaleGenderTotalClericalCustodialManagerEmployment CategoryTotalChi-Square TestsChi-Square Tests79.277a2.00095.4632.000474Pearson Chi-SquareLikelihood RatioN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0

7、%) have expected count less than 5. Theminimum expected count is 12.30.a. 对数线性模型的基本理论和方法对数线性模型的基本理论和方法研究两个属性变量之间的关联方式 正向影响?负向影响?没有影响?研究方法:双因素方差分析 频率的分解频率的分解A1AB均值均值均值均值2A3A1B2B11122221323121213频率对数表)ln(ijijp 频率对数分解式频率对数分解式)()()( jiijjiijijji 属性属性A的效应的效应属性属性B的效应的效应 A与与B的交互效应的交互效应0 jijiijji A1ABB的效应的效

8、应A的效应的效应2A3A1B2B11122221323121213 =0 =0 属性属性A A与与B B相互独立相互独立ij jiijp lnjiepij jiijppp IiJjIiJjijjieep11111 ji,所有所有属性间的关联度分析属性间的关联度分析ij正效应正效应独立独立负效应负效应某个某个 在统计意义上是在统计意义上是否为零需要进行假设检验否为零需要进行假设检验ij 对数线性模型的对数线性模型的SPSS实现实现1AAB合计合计合计合计2A3A1B2B11n12n22n21n32n31n2n1n2n1n3nn频数列联表SPSS中的数据输入中的数据输入21n12n22n频数A水平

9、B水平12312311122232n11n31n例题例题某企业想了解顾客对其产品是否满意,同时还想了解不同收入的人群对其产品的满意程度是否相同.在随机发放的1000份问卷中收回有效问卷792份,根据收入高低和满意回答的交叉分组数据如下:列联表与对数线性模型的估计结果列联表与对数线性模型的估计结果53384341081114859819491542159792对数线性模型的对数线性模型的SPSS实现过程实现过程属性的效应关系表属性的效应关系表ABB的效应的效应A的效应的效应1222323123-.2603* .2689* -.6826* .8826* .4248* 高收入中收入低收入满意不满意

10、Logistic回归基本理论和方法回归基本理论和方法研究某一事件发生的概率P=P(y=1)与若干因素之间的关系 qqxxp 110在在0和和1之间之间任意范围之间的数量任意范围之间的数量若干个状态的标量若干个状态的标量logistic变换logistic变换Logistic回归模型 ),(1ln ppqqxxpp 1101ln概率概率p的预测的预测P与多因素之间的关系预测qqqqxxxxeep 1101101)(11011qqxxep qqxxpp 1101lnP与单因素之间的关系图与单因素之间的关系图px1xxeep10101 01 0.80.2回归系数的含义回归系数的含义优势比(Odds

11、Ratio)事件发生与不发生的概率比优势比与单变量系数之间的关系 qqxxeppOR 1101),(), 1,(2121qiqixxxxORexxxxORi 00ii优势比增加,成功的概率增加优势比减小,成功的概率减少解释变量增加一个单位优势比扩大或缩小相应系数的指数倍Logistic回归回归系数的估计系数的估计(分组数据分组数据)n组观测数据结构:iN序号序号x参加调查参加调查总数总数事件出现事件出现次数次数im事件出现事件出现频率频率iiNmLogistic 变换变换12ni1x2xixnxiN1N2NnN1m2mimnm1p2pnpip )1(lniipp 1p2pipnp拟合模型 其中

12、 近似服从iiixp 10i)1(1, 0(2 iiippNN ni, 2 , 1 转换成经典回归模型 iiiiiiiiiiiiiiippNxppNppNpppN )1()1()1()1(10 iiiiuXXz 1100 iu), 0(2 N其中 近似服从(weight)例题例题 在一次住房展销会上,与房地产商签订初步购房意向书的共有n=325名顾客.在随后的三个月里,只有一部分顾客确实购买了房屋.以顾客的年家庭收入 x(万元)为自变量,建立Logistic回归模型.RegressionLinear点击点击Model SummaryModel Summary.952a.906.892.2224

13、076Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 家庭收入a. A AN NO OV VA Ab b, ,c c3.32413.32467.207.000a.3467.0493.6718RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 家庭收入a. Dependent Variable: logistic值b. Weighted Least Squares Reg

14、ression - Weighted by weightc. CoefficientsCoefficientsa,ba,b-.868.107-8.093.000.153.019.9528.198.000(Constant)家庭收入Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: logistic值a. Weighted Least Squares Regression - Weighted by weightb. Logistic 回归方程回归方程 于是

15、于是: 当当x=8万万, , p=0.58810.8680.15311 exp(0.8680.153 )pLnxppx Logistic回归回归系数的估计系数的估计(未分组数据未分组数据)n组观测数据: 与 的关系 );,(21iiqiiyxxxiyiqiixxx,21qqqqxxxxiieepyE 1101101)(), 1(ipBiy 的分布函数 的似然函数iyiiyiyiippyp 1)1()(nyyy,21 niniyiyiiiippypL111)1()(似然函数的对数表达利用迭代法求解似然函数对数的最大值点就是参数的极大似然估计,记为: niiiiipypyL1)1ln()1(lnl

16、n nixxiqqiiiqqiexxy1110)1ln()(110 q ,10拟合的优良性 212)( iiD回归模型的优良性回归系数的显著性-2log(L)Wald=2R 零假设: 因变量实际分布与预测的分布无差异 决策准则: 拒绝零假设 模型不显著例题例题(估计金融机构正常运转的概率估计金融机构正常运转的概率)Detecting ailing financial and business establishments is an important function of audit and control. We have some of the operating financial ratios of 33 firms that went bankrupt after 2 years and 33 that remained solvent during the same period. Three financial ratios were available for each firm: Independents and Dependentassetstotalearni

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 统计学

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!