《HJ1353—2024环境空气颗粒物来源解析正定矩阵因子分解模型计算技术指南.docx》由会员分享,可在线阅读,更多相关《HJ1353—2024环境空气颗粒物来源解析正定矩阵因子分解模型计算技术指南.docx(14页珍藏版)》请在第壹文秘上搜索。
1、HJ中华人民共和国国家生态环境标准HJ13532024环境空气颗粒物来源解析正定矩阵因子分解模型计算技术指南AmbientairSourceapportionmentonparticulatematterTechnicalguideonpositivematrixfactorizationmodelcalculation本电子版为正式标准文本,由生态环境部环境标准研究所审校排版。2024-05-01 实施2024-02-18发布生态环境部发布前言ii1适用范围12规范性引用文件13术语和定义14模型原理和计算流程25数据准备36基础计算47旋转计算68颗粒物源贡献计算69结果合理性判断6附录A
2、(资料性附录)颗粒物源类识别方法及主要源类的标识组分8附录B(资料性附录)PMF模型计算记录表9,.Z11刖S为贯彻中华人民共和国环境保护法中华人民共和国大气污染防治法,加强大气污染防治,保护和改善生态环境,保障人体健康,规范环境空气颗粒物来源解析工作中正定矩阵因子分解(PMF)模型计算,制定本标准。本标准属于环境空气颗粒物来源解析系列标准之一,规定了PMF模型计算方法。本标准的附录A和附录B为资料性附录。本标准为首次发布。本标准由生态环境部大气环境司、法规与标准司组织制订。本标准主要起草单位:中国环境监测总站、南开大学、中国环境科学研究院。本标准生态环境部2024年2月18日批准。本标准自2
3、024年5月1日起实施。本标准由生态环境部解释。环境空气颗粒物来源解析正定矩阵因子分解模型计算技术指南1适用范围本标准规定了正定矩阵因子分解(PMF)模型计算的数据准备、基础计算、旋转计算、颗粒物源贡献计算、结果合理性判断等技术要求。本标准适用于应用PMF模型对环境空气颗粒物进行来源解析相关的计算工作。2规范性引用文件本标准引用了下列文件或其中的条款。凡是注明日期的引用文件,仅注日期的版本适用于本标准。凡是未注日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。HJ630环境监测质量管理技术导则HJ1352环境空气颗粒物来源解析基于手工监测的受体模型法监测数据处理与检验技术规范环境空气
4、颗粒物来源解析监测技术方法指南(监测函(2020)8号)3术语和定义下列术语和定义适用于本标准。3. 1环境受体ambientreceptor受到污染源排放影响的环境空气,简称受体。3.2正定矩阵因子分解模型positivematrixfactorizationmodeI(PMF)将样本数据的X矩阵分解为因子贡献G矩阵和因子谱F矩阵,对因子谱F矩阵进行识别,并定量计算样本的因子贡献的一种多元因子分析类模型。3.3污染源化学成分谱sourcechemicalprofiIe特定污染源类排放颗粒物的相对稳定的化学组分信息(gg),简称源成分谱。源成分谱应包含该类污染源的标识组分。3.4污染源贡献so
5、urcecontribution通过受体模型计算得到的污染源对环境空气颗粒物的贡献,用贡献浓度(gm3)或贡献占比表示。3.5污染源标识组分sourcechemicaltracer污染源化学成分谱中对该源类有指示作用的一种或多种颗粒物化学组分,又称示踪组分。源标识组分是区别该源类与其他源类的重要标识物,每种污染源有各自的标识组分。1.1 6因子factorPMF模型计算提取的G矩阵和F矩阵的每列信息,其中F矩阵的每列可识别为特定污染源类,G矩阵的每列可计算得到特定污染源类的贡献。3.7Q值函数fundionQvalue反映PMF模型计算结果质量的一种目标函数。3.8残差residuaI颗粒物化
6、学组分的实际测试值与PMF模型计算值之间的差值。3.9基础计算baserun在计算过程中不加入任何数学、物理意义的约束条件,只根据模型Q值函数的收敛条件(Q值最小)得到因子贡献G矩阵和因子谱F矩阵的一种PMF模型计算方法。3.10 10旋转计算rotationaIrun对于基础计算得到的因子贡献G矩阵和因子谱F矩阵,加入一定的约束条件再次进行计算,转换成另一对矩阵(G*和F*),使各因子谱的标识组分更加突出,从而解决因子谱难以识别问题的一种PMF模型计算方法。4模型原理和计算流程4.1模型原理在环境空气颗粒物来源解析中,PMF模型计算是将受体颗粒物化学组分浓度矩阵XtnXm因子化,分解为两个因
7、子矩阵,GmXM和&/M,以及一个残差矩阵Esxm(见公式1),在G矩阵和F矩阵中的数值都是正值(即非负限制)的限定下,通过定义一个目标Q值函数(见公式2),选择Q值函数值最小时的G矩阵(因子贡献矩阵)和F矩阵(因子谱矩阵)计算结果,再利用污染源标识组分将F矩阵识别为不同的源类,对G矩阵进行多元线性回归计算,从而得出不同源类对环境样品的贡献。X(胸)=G”断题阚)+4加“a)式中:XSXM受体颗粒物化学组分浓度X矩阵;xp)因子贡献G矩阵;F(Pmf因子谱F矩阵;E残差E矩阵;样品个数;m化学成分种数;P解析的因子(污染源)数目。Q=)2式中:Q目标。值函数;EiJ一一第i个样品中第j个化学成
8、分的残差;3第i个样品中第j个化学成分的不确定度;Zl样品个数;m化学成分种数。4.2计算流程应用PMF模型进行颗粒物来源解析的计算流程包括数据处理和检验、基础计算及结果分析、旋转计算及结果分析、模型计算结果合理性判断等环节,见图KPMF模型计算需要进行反复优化计算,调整计算数据和参数,以得到相对较优的计算结果。图1PMF模型计算流程5数据准备5.1 数据种类和数量要求。PMF模型需要输入环境空气颗粒物质量浓度以及无机元素、碳组分、水溶性无机离子等化学组分浓度数据,应不少于100个有效样品的数据量。颗粒物化学组分需涵盖主要污染源的标识组分,常用的标识组分包括有机碳(OC)、元素碳(EC)、S4
9、2-,No3-、Cl,NHs+、Si、Al、Na、Mg、K、Ca.Mn.Fe、Cu、Zn等。为解析更多的源类,可增加多环芳烧、左旋葡聚糖、正构烷烧、脂肪酸、俗醉类、有机酸等一次和二次有机标识组分。5.2 数据质量要求。用于颗粒物来源解析工作的监测数据,应按照采用国家标准、行业标准、地方标准的优先次序获得;无国家标准、行业标准、地方标准的,可采用国际标准、国外标准或研究建立的方法,经评估确认满足方法要求后使用,同时监测工作需按照HJ630的要求纳入质量管理体系,开展质量保证和质量控制工作并符合相关要求。5.3 数据格式要求。PMF模型需要输入两个数据文件:(1)颗粒物及化学组分质量浓度的数据文件
10、,(2)颗粒物及化学组分质量浓度不确定度的数据文件。两个数据文件内容需要对应,格式符合模型软件的要求。5.4 数据检验。对于每个颗粒物样品的颗粒物及化学组分质量浓度数据,按照HJ1352,进行颗粒物化学组分质量平衡、阴阳离子电荷平衡等数据检验。5.5 不确定度计算。不确定度是颗粒物来源解析工作中采样、实验分析等环节引起的误差,直接影响输入PMF模型中样品颗粒物及化学组分质量浓度数据的计算权重,根据以下公式进行计算:-MMDL(3)4式中:Unc颗粒物及化学组分的不确定度,gm3;MDL一一颗粒物及化学组分的检出限,gm3oUnc=V(EFXConc)2+(0.5KMDLr(4)式中:UnC一颗
11、粒物及化学组分的不确定度,gmMDL颗粒物及化学组分的检出限,gm3:Conc颗粒物及化学组分的质量浓度,gm3;EF一颗粒物及化学组分质量浓度的误差系数(ErrorfraCtion)。当COnC小于等于MDL时,采用公式(3)计算;当ConC大于MDL时,采用公式(4)计算。EF大小范围一般为0J0.6,如颗粒物及化学组分质量浓度接近检出限或数据缺失较多时,则相应采用较大的数值。6基础计算6.1基础计算运行6.1.1 数据的模型检验。通过PMF模型的浓度散点图、时间序列图等,检验不同化学组分之间关系、化学组分随时间变化情况。对于异常高或者低的化学组分数据,经核实没有特定污染过程(如沙尘天气等
12、),可予以剔除。6.1.2数据计算权重的选择。颗粒物的关键标识组分(如OC、EC、SO?NO3-、NH4+、Al、Si、Ca、K、Fe等化学组分)的计算权重需设为“强”。其他非关键标识组分(如ChNa、Mg、Cu,Cd、Cr等化学组分)的计算权重通常设为“强”,如测量不确定性较高,可设为“弱”计算权重。6.1.3因子个数的确定。因子个数需要基于对颗粒物可能来源、样品数量、采集时间等,通过模型反复计算确定。首先根据工作区域的基本情况(如当地排放源清单、污染源普查数据、工业布局、能源结构、机动车保有量等信息),初步确定因子个数的范围。然后通过设置不同的因子个数尝试计算,对各计算情况进行分析,结合工
13、作区域基本情况,验证和确定适合的因子个数,常用方法如下:1)根据Q值随因子个数变化关系判断。在设定合适的不确定度后,可逐渐增加因子数,观察Q值的变化。当因子数逐渐增加,而对应结果的Q值没有明显变化,则此时因子数增加为合理。当因子数增加到某一特定值(例如P),Q值开始有明显变化,则P-I则可能为合适的因子数。2)根据化学组分的加权残差大小判断。化学组分的加权残差(尤其是标识组分)应在正负3以内,如果加权残差有较大的分布,则应重新检查因子个数。3)根据多次计算结果的差异情况判断。多次运行不应该得到多个Q值或因子谱差异性比较大的结果(如20次运行的结果中,有多个结果之间差异较大),如有,则说明因子数
14、的设定可能不合理。4)根据回归分析结果判断。将G矩阵与颗粒物浓度数据进行回归分析。如果回归系数出现负值,说明因子个数设置可能过多或存在共线性源;将F矩阵的每一个因子除以相应的回归系数后分别各自加利,如果大于1.2,则说明选择的因子个数不合理。6.2 基础计算的结果判断6.2.1 对基础计算得到的多个计算结果,需进一步判断分析。首先,通过Q理论值(QThg)和Q计算值(QTnIC)的大小、是否收敛等,初步选择查看特定的计算结果。然后,从Q计算值与Q理论值差异分析、观测值/预测值差异分析、残差分析(ReSidUalanalySiS)等对计算结果进一步判断。6.2.2 Q计算值与Q理论值越接近(85
15、%115%之间),表明计算结果更合理。6.2.3 通过“观测值/预测值差异分析”,分析输入的观测值和计算得到的预测值的相关性。如果某化学组分的观测值和预测值之间有强相关性,则表明该化学组分计算较好:反之,则考虑是否应该降低该化学组分计算权重或从计算中排除。此外,还可以在时间序列上分析化学组分的观测值和预测值的差异。对于预测值明显高于观测值,需要进一步分析确定是否排除该数据。6.2.4 通过“残差分析”,查看每一个化学组分的加权残差(通过不确定度加权)。比如,通过残差直方图中不同化学组分加权残差的百分比,判断各化学组分在基础计算的情况。如果残差直方图显示残差范围在(-3,+3)之间,则该化学组分的模型计算在数学意义上较好:如果化学组分具有许多较大的残差或显示非正常高斯分布曲线,则表示该化学组分的模型计算在数学意义上较差。6.3 基础计算的结果分析6.3.1 基础计算的结果主要包括因子谱F矩阵和因子贡献G矩阵。因子谱识别是PMF模型计算的关键,可通过分析不同因子谱中标识组分,将因子谱识别为具体的污染源类。颗粒物源类识别