《应用统计学复习.ppt》由会员分享,可在线阅读,更多相关《应用统计学复习.ppt(36页珍藏版)》请在第壹文秘上搜索。
1、内容提要应用统计学复习 方差分析、回归分析方差分析、回归分析 聚类与判别聚类与判别 主成分分析与因子分析主成分分析与因子分析 列联表与对应分析列联表与对应分析 结构方程模型结构方程模型 重点:重点:软件计算结果的软件计算结果的分析,模型分析与比较分析,模型分析与比较一、方差分析基本概念基本概念方差分析的类型方差分析的类型l单因素方差分析l单响应变量方差分析:重复试验/非重复试验l多响应变量方差分析l协方差分析:当存在非实验因素干扰协方差分析如何确定协变量如何确定协变量若因素作用显著,进一步分析工具:多重均值比较若因素作用显著,进一步分析工具:多重均值比较lLSD, Dunnett法,均值多项式
2、比较输出表的解释,假设检验输出表的解释,假设检验lF检验:F统计量的计算,查临界值主体间效应的检验主体间效应的检验因变量: sale674295.333a5134859.076.640.0017836408.16717836408.2385.858.000600412.5832300206.2914.782.00032.667132.667.002.96873850.083236925.0421.818.191365562.5001820309.0288876266.000241039857.83323源校正模型截距priceadvertisprice * advertis误差总计校正的总计I
3、II 型平方和df均方FSig.R 方 = .648(调整 R 方 = .551)a. 因变量: saleTamhane234.250084.56630.055-4.3729472.8729384.3750*78.96715.003152.0008616.7492-234.250084.56630.055-472.87294.3729150.1250*48.03335.02617.2228283.0272-384.3750*78.96715.003-616.7492-152.0008-150.1250*48.03335.026-283.0272-17.2228(J) price231312(I
4、) price123均值差值(I-J)标准误Sig.下限上限95% 置信区间基于观测到的均值。Tests of Between-Subjects EffectsDependent Variable: SALE866760.344a6144460.05714.188.0008742.06618742.066.859.367192465.0111192465.01118.902.000393082.7932196541.39619.302.000113931.7371113931.73711.189.00445304.159222652.0792.225.139173097.4891710182.
5、2058876266.000241039857.83323SourceCorrected ModelInterceptSTORESIZPRICEADVERTISPRICE * ADVERTISErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .834 (Adjusted R Squared = .775)a. 协变量调整后多变量检验多变量检验b b.961696.176a2.00057.000.000.039696.176a2.00057.000.00024.427696.176a2.000
6、57.000.00024.427696.176a2.00057.000.000.2579.838a2.00057.000.000.7439.838a2.00057.000.000.3459.838a2.00057.000.000.3459.838a2.00057.000.000Pillai 的跟踪Wilks 的 LambdaHotelling 的跟踪Roy 的最大根Pillai 的跟踪Wilks 的 LambdaHotelling 的跟踪Roy 的最大根效应截距adtype值F假设 df误差 dfSig.精确统计量a. 设计: Intercept+adtypeb. 二、多元线性回归模型简单相关
7、系数与偏相关系数简单相关系数与偏相关系数多元线性回归模型及基本假设多元线性回归模型及基本假设OLS估计量的性质估计量的性质l线性性、无偏性、有效性OLS估计量方差的性质估计量方差的性质偏回归系数的含义偏回归系数的含义l设定偏误,遗漏重要变量时OLS估计量的性质ikikiiXXY110模型的检验经典假设检验:异方差、序列相关、多重共线经典假设检验:异方差、序列相关、多重共线统计检验:统计检验:l方差分析、拟合优度与方程的显著性检验三种平方和,联合零检验,三种平方和,联合零检验,F统计量统计量l单零检验,一般t检验:查表法、精确P值l拟合优度R2经济意义检验经济意义检验)(022Set检验统计量服
8、从自由度为n-k-1的t分布) 1,() 1/()1 (/22knkFknRkRFANOVAANOVAb b324797742564959548137.116.000a5685056.112473754.6833048279817回归残差合计模型1平方和df均方F显著性a. 模模型型摘摘要要b b.991a.983.976688.29839201.811模型1RR 方调整的 R 方估计的标准差Durbin-Watson预测变量:(常量), 劳动力(万人), 播种面积(千公顷), 机械总动力(万千瓦), 成灾面积(公顷), 化肥施用量(万公斤)。a. 系数系数a a-12815.7514078.
9、905-.910.3816.213.7411.2828.385.000.06116.309.421.127.1653.320.006.5791.727-.166.059-.190-2.807.016.3143.188-.098.068-.223-1.445.174.06016.643-.028.202-.007-.140.891.5731.745(常量)化肥施用量(万公斤)播种面积(千公顷)成灾面积(公顷)机械总动力(万千瓦)劳动力(万人)模型1B标准误非标准化系数Beta标准化系数t显著性容差VIF共线性统计量因变量: 粮食产量(万吨)a. SPSS线性回归过程输出表与残差图多重共线性概念:
10、概念:l什么是多重共线性l完全多重共线、非完全多重共线多重共线的后果多重共线的后果多重共线的识别多重共线的识别l存在多重共线时OLS的特征l检验方法:方差膨胀倍数、病态指数、辅助回归补救措施:差分,剔除变量,主成分回归补救措施:差分,剔除变量,主成分回归异方差性什么是异方差性,异方差性经常出现在什什么是异方差性,异方差性经常出现在什么数据中么数据中异方差性的后果异方差性的后果异方差性的识别异方差性的识别l非正式方法:残差图异方差性的修正异方差性的修正l加权最小二乘法 序列相关什么是序列相关,什么数据容易出现序列什么是序列相关,什么数据容易出现序列相关,一阶自相关模式相关,一阶自相关模式序列相关
11、的后果序列相关的后果序列相关性的检验序列相关性的检验lDW检验序列相关的修正序列相关的修正l广义差分模型虚拟变量虚拟变量的概念虚拟变量的概念含有虚拟变量的回归含有虚拟变量的回归l虚拟变量如何设计l级差截距系数的作用是什么、级差斜率系数的作用是什么l如何检验虚拟变量的系数是否显著ttttttXDXDY)(2121三、聚类与判别各类距离与相似系数各类距离与相似系数系统聚类:系统聚类:l手算:最长距离法、最短距离法,画谱系图、确定分类数系统聚类和快速聚类的输出表分析系统聚类和快速聚类的输出表分析判别分析两类判别:手算或输出表分析,马氏等距两类判别:手算或输出表分析,马氏等距离法、离法、fisher法
12、、贝叶斯法建立判别函数法、贝叶斯法建立判别函数和判别规则,给新样本会做判别和判别规则,给新样本会做判别多类判别:输出表的解释,写出判别函数多类判别:输出表的解释,写出判别函数和判别规则,给新样本会做判别和判别规则,给新样本会做判别检验结果检验结果581.5794.2391352030661.6.000箱的 M近似。df1df2Sig.F对相等总体协方差矩阵的零假设进行检验。结构矩阵结构矩阵.953*-.135.026-.167.897*.122-.039.629*-.502-.128.582*-.140.124.519*.406.176.274*-.070-.163.244*.171.228.
13、064.330*.035.004-.283*Level of educationYears with currentemployerYears at currentaddressAge in yearsHousehold incomein thousandsMarital statusRetiredNumber of peoplein householdGender123函数W Wi il lk ks s 的的 L La am mb bd da a.779248.37827.000.93665.23716.000.98910.7707.149函数检验1 到 32 到 33Wilks 的Lamb
14、da卡方dfSig.Canonical Discriminant FunctionsFunction 16420-2-4Function 2420-2-4Cluster Number of CaGroup CentroidsUngrouped Cases321321四、主成分分析化简变量的方法化简变量的方法l基本概念:方差贡献与累计方差贡献方差贡献与累计方差贡献主成分载荷与变量共同度主成分载荷与变量共同度主成分提取方法:相关矩阵主成分提取方法:相关矩阵vs 方差方差-协方差矩阵协方差矩阵l解释模型的各种输出表,会确定主成分的个数,主成分的经济意义与样本评价(主成分得分)l主成分分析的应用:主成
15、分回归,综合评价指标Scree PlotComponent Number87654321Eigenvalue76543210五、因子分析探索性因子分析与确认性因子分析的区别与联系探索性因子分析与确认性因子分析的区别与联系探索性因子分析探索性因子分析l基本概念:正交因子模型,方差贡献与累计方差贡献,因子载荷正交因子模型,方差贡献与累计方差贡献,因子载荷与变量共同度与特殊因子方差,因子旋转与变量共同度与特殊因子方差,因子旋转l解释模型的各种输出表,会确定公因子的个数,因子分析适宜度检验与残差检验,因子经济意义与样本评价(因子得分)确认性因子分析确认性因子分析l载荷t检验、相关性t检验l总体检验:2
16、、GFI、AGFIl测量模型可靠度分析说明的总方差说明的总方差2.43140.51240.5122.43140.51240.5122.07034.49875.0102.07034.49875.010.4397.31982.329.3876.45088.778.3806.34095.118.2934.882100.000成分123456合计方差的 %累积 %合计方差的 %累积 %初始特征值提取平方和载入提取方法:主成分分析。再生相关性再生相关性.569b.600.185.071-.585-.164.600.652b.091-.033-.643-.071.185.091.652b.631-.047-.630.071-.033.631.634b.075-.613-.585-.643-.047.075.637b.029-.164-.071-.630-.613.029.609b-.004-.023.018-.007-.006-.004.040-.034.002.006-.023.040.001.020-.002.018-.034.001-.018.003-.007.002.020-.018.00