SAS软件与统计应用论文.docx

上传人:p** 文档编号:1049231 上传时间:2024-06-23 格式:DOCX 页数:13 大小:50.57KB
下载 相关 举报
SAS软件与统计应用论文.docx_第1页
第1页 / 共13页
SAS软件与统计应用论文.docx_第2页
第2页 / 共13页
SAS软件与统计应用论文.docx_第3页
第3页 / 共13页
SAS软件与统计应用论文.docx_第4页
第4页 / 共13页
SAS软件与统计应用论文.docx_第5页
第5页 / 共13页
SAS软件与统计应用论文.docx_第6页
第6页 / 共13页
SAS软件与统计应用论文.docx_第7页
第7页 / 共13页
SAS软件与统计应用论文.docx_第8页
第8页 / 共13页
SAS软件与统计应用论文.docx_第9页
第9页 / 共13页
SAS软件与统计应用论文.docx_第10页
第10页 / 共13页
亲,该文档总共13页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《SAS软件与统计应用论文.docx》由会员分享,可在线阅读,更多相关《SAS软件与统计应用论文.docx(13页珍藏版)》请在第壹文秘上搜索。

1、摘要木学期通过对GSAS软件与统计应用这门课的学习,让我知道SAS系统是个大型的应用软件系统,具有完备的数据访问、管理、分析、呈现,以与应用开发功能。这篇文章运用主成分分析综合评价方法,对1999年我国西部地区教化人力资源发展水平进行处理和分析,采纳的是西域,新疆等西部省份教化人力资源发展水平(原始数据见附录)。选出14个省的状况作为统计分析数据,其中分析的项目为:每百万人口学校数;每十万人口毕业生数;每十万人口招生数:每十万人口在校生数;每十万人口探讨生数:每十万人口教职工数:每十万人口专职老师数;高级老师占专职老师的比例;每所学校在校生数:生师比。依次用Al,A2,A3,A4,A5,A6,

2、A7,A8,A9,AlO表示。用“分析家”作主成分分析,并且对数据进行如下处理:第一:对r所选取的统计数据进行简洁描述统计分折,得出数据的平均值、数据标准差,最大值,最小值等。其次:对于所选取的统计数据用“analyst”作主成分分析计算相关系数矩阵的特征值、上下特征值之差、各主成分的方差贡献率、以与累积贡献率。第三:由相关系数矩阵的两个最大特征值的特征向量,可以写出第、其次主成分的得分。第四:在insight”里面绘制了散点图。由图可知,在散点图越靠向右上角的地区,教化人力资源发展水平越高,越靠向左上角的地区,教化人力资源发展水平越低。从以上结论分析可以知道影响各省份教化人力资源发展水平的主

3、要因素,从而可以更好地帮助国家调整教化人力资源结构,更好地发展我国西部教化事业。关键字:analyst主成分分析教化人力资源发展MEANS过程目录第一章基本介绍11.l探讨目的11.2 采纳方法11.3 理论学问1其次章数据预处理2第三章详细模型23.1 建立数据集23.2 详细模型(程序)4运行结果与分析54.1 运用“分析家”做主成分分析的步骤54.2 主成分的结果分析6参考文献9附录10第一章基本介绍1.1 探讨目的通过SAS软件分析,对1999年我国西部地区教化人力资源发展水平有一个大致J解。随着国家教化方针的调整,西部各地区为促进本地区的教化发展,分别实行了各种措施,教化方面的发展有

4、了显著地成就。本文通过SAS软件分析,对1999年我国西部地区教化人力资源发展水平有一个大致了解,从而可以更好地帮助国家调整(优化)教化人力资源结构,使人民的受教化水平更加优越。1.2 采纳方法(1)描述性统计量:means0(2)检验:运用analyst模块进行主成分分析。1.3 理论学问MeanS过程(均值过程):用于对数据型变量产生针对单个变量的简洁描述性统计。pr。CmeanS过程时,会对全部数值型变量进行操作,得到各变量的非缺失观测数N,均值MEAN,标准差STDDEV,最大值MaX和域小值Min五种统计值,但means过程可以计算16种统计星。主成分分析:是对于原先提出的全部变量,

5、建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变型在反映课题的信息方面尽可能保持原有的信息。主成分分析是数学上对数据降维的种方法。其基本思想是设法将原来众多的具有肯定相关性的指标(比如P个指标,重新组合成组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。在全部的线性组合中所选取的Fl应当是方差最大的,故称Fl为第一主成分。假如第主成分不足以代表原来P个指标的信息,再考虑选取12即选其次个线性组合。为了有效地反映原有信息,Fl已有的信息就不须要再出现在F2中,用数学语言表达就是要求COV(F1,F2)=0d称F2为其次主成分,

6、依此类推可以构造出第三、第四、第P个主成分。其次章数据处理对数据较少的程序,可以用DATA步建立永久的SAS集。永久的SAS集,由定义逻辑库与定义数据集两步完成。逻辑库定义通过1.IBNAME语句完成,数据集定义用DATA语句实现。指定逻辑库的吩咐语句为全程语句,其格式如下:1.IBNAME逻辑库名路径;指定要建立数据集的吩咐语句格式如下:DT逻辑库名.数据集名;1.IBNAME语句把磁盘中的子书目与用户定义的逻辑库名连接起来.用此方法依据已知的数据就可以建立生成以下的数据集。第三章详细模型3.1建立数据集2012年11月19日星期一卜,午12时19分55秒5ObsregionlA2A3A4A

7、5A6A7A8A9AlO1海南0.66496419112.047192广西0.62416919234.0401830.33山西311310.4500.726111819360.0743040.334092内蒙古10.1700.80467721153.0713250.36四川26177.4300.7566112314164.0773260.39重庆419910.1000.504177211120.0532170.37贵州419210.1000.54286715221.0351680.33云南28238.9500.57386617649.0442090.38西藏307983611.56426515

8、73.96830O.1410陕西10055.1001.19100188496398.014055110.36I甘肃41739.9000.715590246113.065270.3112青海34809.2301.18-196818317.0683413宁更0.92498324225.073330.3326247.52014新瓠0.966611030551.096420.3031807.2303.2详细模型(程序)Datawork,datal;inputregion$1-10AlA2A3A4A5A6A7A8A9A10:cards:海南0.6649641911247190.33291410.16广西

9、0.6241691923440180.33311310.45山西0.72611181936074300.33409210.17内蒙古0846772115371320.3626177.43四川0.756611231416477320.39419910.1重庆0.5417721112053210.37419210.1贵州0.5428671522135160.3328238.95云南0.380.57383079661764944208361西敏0.141.56421005651573.968305.1陕西0.361.191004173188496398140559.9甘肃0.310.71553480

10、9024611365279.23青海0.21.18491558681831768345.32宁夏0.330.92492624832422573337.52新疆0.96660.33180run:procprint;run:HO3055196427.23第四章运行结果与分析4.1运用“分析家”做主成分分析的步骤1)在“分析家”中打开数据集Work.datal;2)选择菜单“Statistics(统计)“wMultivariate(多元分析)”wPrincipalComPOnentS(主成分分析)”,打开PrincipalComponents,对话框;3)在对话框中输入主成分分析的变量,如图4-1;

11、图4T4)单击“Statistics(统计)按钮,打开uPrincipalComponents:Statisticsn对话框:在#ofcomponents:,右边的框中指定主成分的个数10,如图4-2,单击“0K”返回;图4-25)单击SaveData”按钮,打开“PrincipalComponents:SaveData,对话机在该对话框中可选择存储数据。选中“Createandsavescoresdata”,如图4-3所示。单击“OK”返回;图4-36)单击“Plots”按钮,打开*PrincipalComponents:Plots对话框,可以设置图形输出。在ScreePlot(碎石图)”选

12、项卡中(图47),选中Createscreeplot(建立碎石图)”复选框。在ComponentPlot(成分图)选项卡中(图4-5),选中wCreatecomponentPlOt(建立成分图)”复选框。图4-4图4-54.2主成分的结果分析输出的数字分析结果包括4个部分:简洁统计量、相关系数矩阵、相关系数矩阵的特征值以与相关系数矩阵的特征向量。1)图4-6给出变量的简洁统计量,图中显示10项指标中A9(每所学校在校生数)、A5(每十万人口探讨生数)、A4(每十万人口在校生数)是最为重要的,其标准差远远高出其他变量图4-62)图4-7可得:A2(每十万人口毕业生数)与A3(每十万人1.l招生数

13、)、A4(每十万人口在校生数)、A6(每十万人口教职工数);A7(每十万人口专职老师数)与A6(每十万人口教职工数与):A4(每十万人口在校牛.数)与A3(每十万人1.l招生数)、A5(每十万人1.I探讨牛.数)有较强的相关性。CorretionIMrlAA23A4能ASAllAlAt1.(0lI.3CS41.247?九25G0.1?0.83110.MC?OM2彻1-.M1t0.4H.nnWA2.3W41.OICrt1.94733113.208o.w0.8?3O-IMO0.2185MA3t.24771.34口1.0l0.81B!0.WI20.SII20.23130.S8)1o.nA4M.2U2.9113I.32W1.0IWe.Me0.W7o.meo.mtO.4O.2W2崎1.17.9X11.8181.SI5.0)(0o.ni3o.mo.t。.硝I解.5tt?.8W.Mt70.7t31.0Jlo0.M1S0.(Qlg。抑5.727

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 论文 > 管理论文

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!