基于聚类分析对我国31个主要城市空气质量的研究.docx

上传人:p** 文档编号:1073326 上传时间:2024-06-29 格式:DOCX 页数:4 大小:12.82KB
下载 相关 举报
基于聚类分析对我国31个主要城市空气质量的研究.docx_第1页
第1页 / 共4页
基于聚类分析对我国31个主要城市空气质量的研究.docx_第2页
第2页 / 共4页
基于聚类分析对我国31个主要城市空气质量的研究.docx_第3页
第3页 / 共4页
基于聚类分析对我国31个主要城市空气质量的研究.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于聚类分析对我国31个主要城市空气质量的研究.docx》由会员分享,可在线阅读,更多相关《基于聚类分析对我国31个主要城市空气质量的研究.docx(4页珍藏版)》请在第壹文秘上搜索。

1、基逑类邠欣俄国31个主要岐15空气质量一、绪论-)选题背景和意义近些年,随着经济的发展和社会的进步,人们的物质生活水平越来越高,但在生态环境和空气质量方面也付出了相当大的代价。在注重生态文明建设强调绿色低碳发展的大背景卜.,研究我国城市空气污染情况,空气质量检测数据的分类方法、类别特征、优劣排序等,挖掘空气质燧数据陷含的重要信息,寻找改善空气质量的对策,具有重要的意义。(二)数据选取按照环境空气质量标准GB3095-2012),空气质量的六项主要监测污染物分别为二氧化硫(SO2).二氧化级(NO2)、可吸入颗粒物(PMlO)、氧化碳(CO).臭氧03)和细颗粒物CPM2.5)因此,本文考虑分析

2、31个环保重点城市这7个具体监测指标,分别为S02年平均浓度x1(gm3).N02年平均浓度x2(gm3).PMlO年平均浓度x3(gm3),Co日均值第95百分位浓度4(mgm3),O3日最大8小时第90百分位浓度x5(gm3).PM2.5年平均浓度x6(gm3),再加上年内空气质量达到及好于二缎的天数x7(天),记作G-day.二、聚类分析(一)k-means聚类1. k-means聚类简介k-means聚类,又称快速聚类法,是一种按样本数据的相似程度符样本分类的方法.需要提前设定聚类个数。相似程度的度量一般按样本间的距离划分,两个样本间距底越小,样本的相似程度越高。2. k-means聚

3、类结果仍然以上述2019年的空气质量数据为例,读入数据,并为数据画出故点图,从样本点的分布的集中程度以看出两个变量之间的线性相关性的强弱.从上图1可以看出,PM2.5与PM10的浓度必正相关,而PM2.5和PM10的浓度均与一年内空气质量达到及好于二级大数(图中记为day)呈较强的负相关,PM2.5和PMlO的浓度越高,好天气数越少,空气质量越差.在实际生活中,表现为雾言严重,空气可见度低,容易引发呼吸系统疾病,危害人们的身体健康“同时可见,G-day与二氧化氮年平均浓度必负相关.NO2的排放源汽车尾气,日常生活中,汽车尾气排放的越多,空气质量越差.以下利用k-means函数对31个城市201

4、9年的空气质足数据进行k-means聚类,令聚类数k由小到大逐渐增加,同时计算类间平方和与总平方和的比值.该比值越大,说明两个类间的差异越大,则类内部的差异越小,聚类的效果越理想.利用R程序可计兑并构造类间平方和与总平方和的比值序列,当k=3之后,组间平方和占比的增幅就很小,变化幅度不超过0.01。组间平方和占比趋近T1.作聚类分析时既要使组间平方和占比尽址大,又要让聚类数不能太大(否则太杂乱),权衡考虑后取k=3为最佳聚类数。利用聚类所得的3类城市的均值点的最后两列数据,将空气质量达到及好T二级的大数(即及后一歹Uday)对三个聚类结果进行排序,如图2所示。(二)PAM聚类1. PAM聚类简

5、介PAM聚类针对k-means聚类法的不足,用类中心点代替质心。PAM和法鉴于k均值算法的这一不足,选取个类中位置城接近质心的数据点作为类中心点,来代替质心,其他数据点就根据距离被分到离数据中心点中最近的那一类。反复根据一类的数据点坐标来调整类中心点,解决了思群点对结果的影响.2. PAM聚类结果本文运用R软件对数据做PAM聚类,运用cluster程序包中的pam函数进行聚类。从各类中选取的即离脑心位置最近的中心点列表如下表1。表1距而质心位置最近的中心点情况上面所得结果是各类的中心点坐标,分别为成都、济南、昆明。聚类中心点是各类城市的代表,从中心点就可以大致看出各类的空气质量。招城市空气质量

6、由好到差排序,结果如下。优(第三类):福州、南宁、海口、贵阳、昆明、拉萨、西宁良(第一类):北京、呼和浩特、沈阳、长春、哈尔滨、上海、南京、杭州、合肥、南昌、武汉、长沙、广州、重庆、成都、兰州、银川、乌瞥木齐。差(第二类):天津、石家庄、太原、济南、郑州、西安.(三)两种聚类分析结果比较时几种聚类结果观察可以发现,按照城市的空气质量好坏分类,几种聚类结果具有一致性,大致客观反映了全国31个环保重点城市空气质Ift状况的分类、空间分布和空气检测指标的实际情况。k-means聚类就不变作图,但k-means聚类能快速聚类,节省时间,给出每一类中的具体成员.PAM聚类是一种基丁质心的划分型聚类算法,

7、与K-MeanS聚类的主要不同在于:第一,距离测度采用绝对聚类。聚类目标是找到类内绝对距离之和最小下的类:第二,增加判断本次迭代类质心合理性的步骤.三、结束语本文对全国31个环保重点城市的空气质量数据通过R软件做了聚类分析。所做的两种聚类分析的结果大体一致。6种主要的空气污染物中,S02与CO之间相关性相对较强,大致主要来源于燃煤的燃烧,NO2、PMI0、。3与PM2.5之间的相关性较强,大致来源于汽车尾气及扬尘污染。从31个环保重点城市空气质量数据的双坐标图中能够看出毋个城市的污染类型,哪些污染物较多。本文工作的不足之处有:主要是相关统计分析方法在深度和广度上还可进一步提高,还应该枳极引入最新的多维数据分析理论和方法到空气质量数据分析过程中,所使用的数据量还不够大,有待于今后加以改进。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 论文 > 毕业论文

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!