SAS软件与统计应用论文.docx

上传人:p** 文档编号:1059379 上传时间:2024-06-29 格式:DOCX 页数:19 大小:133.64KB
下载 相关 举报
SAS软件与统计应用论文.docx_第1页
第1页 / 共19页
SAS软件与统计应用论文.docx_第2页
第2页 / 共19页
SAS软件与统计应用论文.docx_第3页
第3页 / 共19页
SAS软件与统计应用论文.docx_第4页
第4页 / 共19页
SAS软件与统计应用论文.docx_第5页
第5页 / 共19页
SAS软件与统计应用论文.docx_第6页
第6页 / 共19页
SAS软件与统计应用论文.docx_第7页
第7页 / 共19页
SAS软件与统计应用论文.docx_第8页
第8页 / 共19页
SAS软件与统计应用论文.docx_第9页
第9页 / 共19页
SAS软件与统计应用论文.docx_第10页
第10页 / 共19页
亲,该文档总共19页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《SAS软件与统计应用论文.docx》由会员分享,可在线阅读,更多相关《SAS软件与统计应用论文.docx(19页珍藏版)》请在第壹文秘上搜索。

1、本学期通过对SAS软件与统计应用这门课的学习,让我知道SAS系统是一个大型的应用软件系统,具有完备的数据访问、管理、分析、呈现,以与应用开发功能。这篇文章运用主成分分析除合评价方法,对1999年我国西部地区教化人力资源发展水平进行处理和分析,我纳的是西陵,新胭等西部省份教化人力资源发展水平(原始数据见附录选出14个省的状况作为统计分析数据,其中分析的项目为:每百万人口学校数:每十万人口毕业生数:每十万人口招生数;每十万人口在校生数;每十万人口探讨生数;每十万人口教职I:数:每十万人口专职老师数:高级老师占专职老师的比例:每所学校在校生数;生师比。依次用Al,A2,A3,A4,A5,A6,A7,

2、A8,A9,AlO表小O用“分析家”作主成分分析,并且对数据进行如下处理:第一:对于所选取的统计数据进行简洁描述统计分析,得出数据的平均值、数据标准差,最大值,最小值等。其次:对于所选取的统计数据用“analyst”作主成分分析计算相关系数矩阵的特征值、上下特征值之差、各主成分的方差贡献率、以与累积贡献率。第三:由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、其次主成分的得分。第四:在“insight”里面绘制了散点图.由图可知,在散点图越界向右上角的地区,教化人力资源发展水平越高,越转向左上角的地区,教化人力资源发展水平越低。从以上结论分析可以知道影响各省份教化人力资源发展水平的主要

3、因素,从而可以更好地帮助国家调整教化人力资源结构,更好地发展我国西部教化事业。关键字:analyst主成分分析教化人力资源发展MEANS过程第一章基本介绍21.l探讨目的21.2 采纳方法21.3 理论学问2其次章数据预处理3第三章详细模型33.1 建立数据集33.2 详细模型(程序)5运行结果与分析74.1 运用“分析家”做主成分分析的步骤74.2 主成分的结果分析9参考文献14附录16第一章基本介绍1.1 探讨目的通过SAS软件分析,对1999年我国西部地区教化人力资源发展水平有一个大致了解。随着国家教化方针的调整,西部各地区为了促进本地区的教化发展,分别实行了各种措施,教化方面的发展有了

4、显著地成就。本文通过SAS软件分析,对1999年我国西部地区教化人力资源发展水平有一个大致了解,从而可以更好地帮助国家调整(优化)教化人力资源结构,使人民的受教化水平更加优越。1.2 采纳方法(1)描述性统计量:means(2)检验:运JnanaIySt模块进行主成分分析。1.3理论学问YeanS过程(均值过程):用于对数据型变量产生针对单个变量的简洁描述性统计。pr。CmeanS过程时,会对全部数值型变量进行操作,得到各变量的非缺失观测数N,均值MEAN,标准差STDDEV,最大值MaX和最小值Min五种统计值,但means过程可以计算16种统计量。主成分分析:是对于原先提出的全部变量,建立

5、尽可能少的新变盘,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。主成分分析是数学上对数据降维的,种方法。其基本思想是设法将原来众多的具有肯定相关性的指标(比如P个指标),重新组合成组新的互不相关的综合指标来代替原来指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。在全部的线性组合中所选取的FI应当是方差最大的,故称Fl为笫一主成分。假如第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选其次个线性组合。为了有效地反映原有佰息,Fl已有的信息就不须要再出现在F2中,用数学语言表达就是要求CoY(F1,F2)=(h称F2为其次主成分

6、,依此类推可以构造出第三、第四、第P个主成分。其次章数据颈处理对数据较少的程序,可以用DATA步建立永久的SAS集。永久的SAS集,由定义逻辑库与定义数据集两步完成.逻辑库定义通过1.IBMWE语句完成,数据集定义用DATA语句实现。指定逻辑库的吩咐语句为全程语句,其格式如下:1.IBNAME逻辑库名路径;指定要建立数据集的吩咐语句格式如下:DATA逻辑库名.数据集名;1.IBNME语句把磁盘中的子书目与用户定义的逻辑库名连接起来。用此方法依据已知的数据就可以建立生成以卜的数据集。第三章详细模型3.1 建立数据集2012年11月19日星期一下午12时19分55秒5ObsregionAlA2A3

7、A4A56A7A8A9AlO1海南0.3329140.6610.160496419112.047192广西0.3331130.6210.450416919234.040183山西0.3340920.7210.1706111819360.074304内蒙古0.3626170.807.430467721153.071325四川0.3941990.7510.10066112314164.077326重庆0.3741920.5010.1004177211120.053217贵州0.3328230.548.950286715221.035168云南0.3830790.578361386617649.04

8、4209西藏0.1410051.565.10042651573.9683010陕西0.3641731.191009.900188496398.014055H甘肃0.715590246113.065270.3134809.23012青海1.18496818317.068340.2015585.32013宁夏0.92-198324225.073330.3326247.52014新疆0.966611030551.096420.3031807.2303.2 详细模型(程序)Datawork,datal:inputregion$1-10AlA2A3A4A5A6A7A8910:cards;海南0.6649

9、641911247190.332914广西0.624110.16691923440180.333113山西0.726110.451181936074300.334092内蒙古081610.17772115371320.362617四川0.75667.4311231416477320.39419910.1重庆0.5417721112053210.37419210.1贵州0.5428671522135160.3328238.95云南0.5738661764944200.3830798361西藏1.5642651573.968300.1410055.1陕西1.19100188496398140550

10、.3641739.9甘市0.71559024611365270.3134809.23青海1.1849681831768340.215585.32宁夏0.9249832422573330.3326247.52新疆0.96661103055196420.331807.23run;procprint;run;第四章运行结果与分析4.1运用“分析家”做主成分分析的步骤D在分析家”中打开数据集WOrkdata1:2)选择菜单Statistics(统计)wMultivariate(多元分析44PrincipalComponents(主成分分析)“,打开PrincipalComponents,对话框:3)在

11、对话框中输入主成分分析的变量,如图4-1:图474)单击Statistics(统计)”按钮,打开44PrincipalComponents:Statistics”对话框;在#ofcomponents:,右边的框中指定主成分的个数10,如图42单击rtOKw返回:图4-25)单击SaveData”按钮,打开“PrincipalComponents:SaveDataw对话框,在该对话框中可选择存储数据。选中Createandsavescoresdata,如图4-3所示。单击“OK”返回;图4-36)单击Plots”按钮,打开PrincipalComponents:Plots对话框,可以设置图形输出

12、。在ScreePlot(碎石图)”选项卡中(图4-4),选中wCreatescreeplot(建立碎石图)”熨选框。在ComponentPlot(成分图)”选项卡中(图4-5),选中“CreatecomponentPlol(建立成分图)”曳选框。PrincipalComponents:PlotsXScreeplotEICmtescreeplotPositiveeigenvaluesOAIIeit.,I1图4-4图4-5ScreePlotCwetPlot4.2主成分的结果分析输出的数字分析结果包括4个部分:简洁统计量、相关系数矩阵、相关系数矩阵的特征值以与相关系数矩阵的特征向量。D图4-6给出变量的简洁统计量,图中显示10项指标中9(每所学校在校生数)、A5(每十万人1.I探讨生数)、A4(每十万人口在校生数)是最为重要的,其标准差远远高出其他变量SiroleSttisUcsAlA2A3A4除Mwn0.834?857143StD0.300SI4357552.21423571I745t427t689.5714285733.S5407370233.500000089.SB283G881.0842857102.5843583SirpleStatisticsMA7A8MAlOIfes67.92857143StO2G.664W229.21

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 论文 > 管理论文

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!