《多指标评估体系的分析.docx》由会员分享,可在线阅读,更多相关《多指标评估体系的分析.docx(15页珍藏版)》请在第壹文秘上搜索。
1、多指标评估体系的分析摘要:本文以地区限额以上工业主要评价指标体系为例,争论了主成分分析、聚类分析以及主成分聚类分析在多指标评估体系中的应用,显示了主成分分析在简化指标体系、突出主要因素方面的作用,体现了聚类分析将相像样本进行聚类,简化数据处理难度的优点,同时也证明白主成分聚类分析的可行性。为全面评价对象,往往给出一个由很多指标构成的评价指标体系。为使信息集中,又常常使用加权平均。这存在以下几个问题:(I)一般评价体系指标众多,由于信息的重叠,一些指标之间存在肯定的相关关系;(2)简洁的加权平均的权重安排有较大的人为因素;(3)简洁的加权平均损失大量信息,主要因素不突出。本文以地区限额以上工业主
2、要评价指标体系为例,采用主成分分析法,构造少数几个综合指标以充分揭示隐蔽在样本数据后的大量信息,突出主要影响因素,以对评价对象作出科学评价;采用聚类分析方法,依据各指标之间的相像性逐步进行归群成类,客观地反映了这些指标之间的内在组合关系,对指标进行群聚,大大简化了数据的处理难度,为评价过程供应有力的依据。采用主成分聚类分析削减了数据的冗余,原理清楚,计算简洁,所得的结论客观,为分析问题供应了有力的依据。1主成分分析法主成分分析基本思想是通过原有变量(指标)的少数几个线性组合来解释原有变量所体现的样本变差。由于原有变量之间的相关性,原有P个变量的大部分样本变差能够由k(比P小很多)个主成分(特别
3、的线性组合)来概括。在新的综合指标体系(指标数将大为削减)中,对评价对象进行分析、类比。设x,X2,.Xp为原有的P个指标;X=WLXP为其标准化观看矩阵;R=(q)pp为其相关系数矩阵;Lj=(/,6l(=12,p)为P个常数向量。考虑如下线性组合:4=fhXJ=l,2,p为P个新指标(主成分)。Zi的样Jt=I本方差VarZi=HRLj,协方差Cov(ZjZj)=L;RLjG;/=1,2,p)。盼望用较少的新指标代替原来的P个指标,就要求它们含有尽可能多的原指标信息且互不相关。指标中所含信息量的大小通常用该指标的方差来表示。设R的特征值和对应的正交单位化特征向量分别为4/l2/lp0;el
4、,e2,,ep,则取乙=6时,VarZj=%,COV(ZjZ,=(i,j=1,2,p)。可以证明原有指标的标准化样本总方差为P,称a为第i个主成分的贡献率;P之Z为前k个主成分的累积贡献率。累积贡献率表明白前k个主成分提取了原tP有指标总信息量的分额,当其达到肯定数值时,用k个主成分代替原有指标将不致于损失太多信息,从而达到削减指标的目的。2聚类分析法聚类分析(CkISterAnaIySiS)是统计学所争论的“物以类聚”问题的一种方法,它属于多变量统计分析的范畴。它是一种建立分类的方法,能够将一批样本数据(或变量)依据它们在性质上的亲疏程度在没有先验学问的状况下自动进行分类。这里,一个类就是一
5、个具有相像的个体的集合,不同类之间具有明显的非相像性。在分类过程中,不必事先给出一个分类标准,聚类分析能够从样本数据动身,客观地打算分类标准。系统聚类法(HierarChiCalCIUSteringMethOdS)也称层次聚类分析法,是目前国内外使用得最多的一种方法。这种方法的基本思想是:先将n个样品各自看成一类,然后规定样品之间的距离和类与类之间的距离。开头,因每个样品自成一类,类与类之间的距离与样品之间的距离是相等的,选择距离最小的一对并成一个新类,计算新类和其他类的距离,再将距离最近的两类合并,这样每次削减一类,直至全部的样品都成一类为止。由此可见,系统聚类方法中,度量数据之间的亲疏程度
6、是极为关键的。这里并没有给定分类的标准,也没有给出全部数据分成几类,而要求比较客观地从数据自身动身进行分类。类与类之间的亲疏程度有最短距离法、最长距离法、中间距离法、重心法、类平均法、离差平方和法等。3应用实例以年全国个省市的项限额以上工业主要评价指标为例(数据来自统计年鉴),见表1,分别用主成分分析和聚类的方法对其进行分析。表1部分岖限额以上工业主要评价指标地区产品隹售及人工业应姚款经济她繇合总资产贡斛魅保值增斛资产负债率全员劳动生产X1亿元X2亿元指教为X4X5X67l北京i857.46380.47101.865.98109.7762.3743925.20天津2034.65445.0810
7、4.587.02115.9561.3633414.17河北29()7.36490.701()4.(X)8,41105.6764.3728311.56山百975.46318.0669.035.02101.5067.7016453.57上海4987.441083.91127.048.24108.6552.3062872.09江苏8343.141363.77105.898.37112.2761.9535613.99浙江4814.59744.35124.2511.38114.38S8.8641074.00翘14()0.462W).3181.1()7,16104.5163.0222859.46福建195
8、1.38341.76108.369.13114.6755.8329443.26山东6566.99K56.(M109.689.55109.6063.3636249.00广东9678.501786.91109.227.26106.0361.1245812.17广声848.91163.8677.736.55105.2769.3724264.62重失816.74224.6167.875.H8109.9469.0820617.75叫Il1853.21447.2585.196.83108.(1941.8122346.29贵州433.72157.8K71.5()7,05104.8771.7821684.85
9、陕百922.56266.6967.675.54107.1269.90I9(II1.O甘肃575.39164.6859.695,4493.6068.5915767.153.1用主成分分析进行分析3.1.1程序:dataal;inputgroup$xl-x7;cards;北京1857.46380.47101.865.89109.7762.3743925.20天津2034.65445.08104.587.02115.9561.3633414.17河北2907.36490.70104.008.41105.6764.3728311.56山西975.46318.0669.035.02101.5067.70
10、16453.57上海4987.441083.91127.048.24108.6552.3062870.09江苏8343.141363.77105.898.37112.2761.9535613.99浙江4814.59744.35124.2511.38114.3858.8641074.00安徽1400.46280.3181.107.16104.5163.0222859.46福建1951.38341.76108.369.13114.6755.8329443.326山东6566.99856.04109.689.55109.6063.3636249.00广东9678.501786.91109.227.2
11、6106.0361.1245812.17广西848.91163.8677.736.55105.2769.3724264.62重庆816.74224.6167.875.88109.9469.0820617.75四川1853.21447.2585.196.83108.0941.8122346.29贵州433.72157.8871.507.05104.8771.7821684.85陕西922.56266.6967.675.54107.1269.9019011.00甘肃575.39164.6859.695.4493.6068.5915767.15procprincompdata=al prefix=z
12、 out=a02;var xl-x7;run;options ps=42 ls=85;proc plot data=a02;plot z2*zl $ group=,*,href=-l href=2 vref=0;run;proc sort data=a02;by zl;run;proc print data=a02;var number zl z2 xl-x4;run;3.1.2运行结果:TheSASSystem20:43Monday,April12,20121ThePRINCOMPProcedureObservations17Variables7SimpleStatisticsxlx2x34
13、x5xx7Mean2998.115294559.784117692.627058827.336470588107.758235362.5158823530571.65859StD2857.113024465.579283321.309008241.6770788515.38891377.4723874812582.99519CorrelationMatrixxl234567xl1.00000.97380.69340.54140.3118-.28870.6675x20.97361.00000.68450.42420.2655-.33840.705430.9340.68451.00000.7940
14、0.8803-.55010.8788x40.54140.42420.79401.00000.5782-.37930.5114x50.31180.20550.68030.57821.0000-.39250.4605x-.2887-.3364-.5501-.3733-.39251.0000-.4404X70.G6750.70540.87680.51140.405-.44041.0000EigenvaluesoftheCorrelationMatrixEigenvaIueDifferenceProportionCuimjIative14.377279773.265718650.82530.625321.111583120.425382350.15880.784130.686180770.2633