欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033

工作时间:9:00-24:00
SCI期刊论文
当前位置:首页 > SCI期刊论文
预测斯里兰卡的PM10水平机器学习模型PM10的比较分析
来源:一起赢论文网     日期:2024-04-12     浏览数:35     【 字体:

 众所周知,自工业革命开始以来,由于各种人为活动,空气质量急剧下降。各种指南控制了排放水平(ABC 2023),然而,人口的增加及其需求不断增加大气中的污染水平(Dadkhah-Aghdash 等人,2022 年)。中国北京(Ariunsaikhan et al., 2023)和印度新德里(Jabbar et al., 2022)最近的空气质量水平使世界上两个高度城市化的地区的大气污染水平感到震惊,不仅引起了当局的极大关注,也引起了研究人员的极大关注(Dubey et al., 2022)。

 
在许多其他污染成分中,颗粒物(PM10 和 PM2.5)对发展中地区的污染水平产生了重大影响(Sang 等人,2022 年;Chen 等人,2023 年)。颗粒物是引发包括肺癌在内的呼吸系统疾病的主要原因之一(Priyankara 等人,2021 年;Mermiri 等人,2022 年;Mowbray 等人,2022 年)。这给许多国家的卫生预算带来了额外的压力(Ramli et al.,2023;Saikiran 等人,2021 年)。因此,对颗粒物的调查对于减轻这些不利影响非常重要。另一方面,包括颗粒物在内的空气质量成分在气候参数之间有一些非线性关系(Malhotra 等人,2023 年)。
 
在预测颗粒物与其他空气质量成分和气候参数的关系时,可以找到许多局部研究(Adnane 等人,2022 年;Ngo 等人,2021 年;易卜拉欣·艾哈迈德·奥斯曼等人,2021 年;Kujawska 等人,2022 年;Choi 等人,2022 年)。由于其局部重要性,这些研究大多是区域性的,并且在考虑不同种类的输入参数的情况下进行开发(Ramli 等人,2023 年)。由于关系的非线性,这些模型中的大多数都基于机器学习技术。在预测方面,随机森林 (RF)、线性回归 (LR) 和支持向量回归 (SVR) 等机器学习模型比传统机器学习模型发挥着重要作用。Saikiran 等人(2021 年)指出,RF、LR 和 SVR 模型在预测空气质量指数方面效果很好。
 
如上所述,已经进行了许多研究工作,通过正确使用机器学习模型来尽量减少对空气质量的负面影响。对PM10和PM2.5等因素的正确预测对政策制定产生了重大影响。根据 Méndez 等人(2023 年)进行的调查。Méndez等人已经表明,使用传统机器学习模型和最新模型的研究小组使用不同的方法。从多层感知器(MLP)、卷积神经网络(CNN)、递归神经网络(RNN)、编码器解码器神经网络(EDNN)开始,向上扩展到支持向量回归(SVR)、决策树(DT)、随机森林(RF)和K-最近邻回归。
 
按照上述最先进的模型算法,Asadollahfardi等人(2016)进行了特定的研究,该研究适用于伊朗的预定义位置,用于PM2.5预测。在结构良好的人工神经网络模型的支持下,他们获得了更高的评估矩阵分数。参考上述研究,可以将ANN模型视为一个运行良好的最先进的模型,可用于预测PM2.5空气质量因子。通过对ANN不同架构模型的分析,可以证明ANN模型的良好结构对于该领域内准确、精确和可靠的预测至关重要。
 
在对PM2.5预测进行时间序列分析之后,Bhatti等人(2021)说明SARIMA(季节性自回归综合移动平均线)模型表现良好。通过将研究区域限制在特定位置,它一直在讨论巴基斯坦拉合尔市PM2.5的预测模式。GRU 是可以以精确方式用于回归的算法之一。Sonawani 等人(2021 年)使用开发的 GRU 模型和双向方法来预测 NO2 印度浦那市的水平。此外,双向方法的发展导致了对数据集更复杂的数据样本模式的理解。最近的一项研究表明,人工神经网络 (ANN) 在预测印度德里的颗粒物 (PM) 水平方面优于支持向量机 (SVM),德里是世界上污染最严重的城市之一。研究人员开发了两个SVM模型,一个具有多项式核,另一个具有线性核,并将它们与ANN模型进行了比较。ANN 模型优于两个 SVM 模型,在预测 PM10 水平方面实现了显着更高的回归系数 (R2 = 0.896)(Masood 和 Ahmad,2023 年)。
 
这一发现表明,人工神经网络是一种比支持向量机更有前途的PM预测方法。 人工神经网络能够学习输入和输出变量之间的复杂非线性关系,这可能就是为什么它们在这项研究中优于SVM模型的原因。多层前馈神经网络(MLFFNN)、支持向量机(SVM)、随机森林(RF)和LSTM已应用于印度德里PM2.5浓度的预测。由于德里被记录为空气污染严重的城市地区,这项研究说明了这项研究工作的必要性。他们在所有最先进的模型和传统的机器学习模型中都取得了更高的回归系数,同时他们已经确定,对于PM2.5浓度的预测,LSTM有能力在数据集上表现良好(印度德里)(Masood和Ahmad,2022)。此外,正确处理该领域中最先进的模型表明,超参数的正确调整已达到更高的回归系数。
 
很明显,先前研究中使用的这些模型被用于这些位置,并且它们在指定位置表现良好。这种局限性背后的隐藏原因是,这些模型的开发只是为了了解特定区域的数据模式。Masood 等人进行的一项伟大工作表明,MLFFNN 模型具有预测 PM2.5 的能力,其性能优于一般回归神经网络、具有自动相关性确定 (ARD) 平方指数核的高斯过程回归和具有 ARD 有理二次核的高斯过程回归(Masood 和 Ahmad,2023 年).此外,通过对比分析,可以明显看出ANN模型比高斯过程回归模型运行得更好。
 
然而,在PM10预测的背景下,人工神经网络表现出更好的表现。此外,由于 ANN 具有研究数据集深层模式的潜力,因此它代表了以总体良好的回归系数预测 PM10 值的能力(Jang 等人,2020 年;Yu等人,2016)。然而,应用于预测空气质量的混合深度学习模型通过与传统机器学习模型竞争而显示出更高的性能(Yu et al., 2016;Hoelzl 等人,2022 年)。研究表明,这种功能是可以预期的,因为人工神经网络和混合模型能够识别数据的深层模式以及根据场景开发数据的可能性。
 
Ramli 等人(2023 年)使用九个监测站的 17 年空气质量数据评估了马来西亚半岛第二天的 PM10 预测性能。他们使用了八个空气质量参数(PM10,NO2所以2、一氧化碳、一氧化碳3、温度、相对湿度和风速)来评估贝叶斯模型平均的性能。此外,Adnane 等人(2022 年)使用非线性自回归人工神经网络预测了摩洛哥阿加迪尔的 PM10 浓度。他们试图在八个参数(PM10、温度、湿度、风速、风向、SO2、CO 和 O3).此外,Choi 等人(2022 年)使用卷积神经网络和长短期记忆深度机器学习方法预测了韩国首尔、仁川、大田和釜山的 PM10 浓度水平。同样,许多其他研究人员使用不同的机器学习技术来预测PM10浓度水平。
 
因此,有必要确定最佳的机器学习模型,以预测当地环境中相对于其他空气质量成分和气候参数的颗粒物。此外,大多数研究人员进行了比较分析,以验证不同情况下的模型,以评估模型的性能。此外,这使研究人员能够确定数据集如何影响与世界不同地区相关的模型的性能。因此,研究工作证明,研究方法应根据所考虑的领域(国家或地区)进行指定。然而,这从未在斯里兰卡的背景下进行过测试,该国最近在城市地区发现了不利的空气质量水平。
 
作为南亚的一个发展中国家,斯里兰卡正在使用重型机械进行一些大规模的建设。由于日常活动,来自全国各地的人们参观了科伦坡和康提这两个高度城市化的地区。
 
最近对空气质量变化的分析表明,巴塔拉穆拉和康提最近面临着一些影响人类生活的空气质量趋势。分析表明,最近该地区的基础设施发展和道路发展都产生了严重影响。这导致在这些区域的大气中添加微小颗粒。因此,很明显,PM10PM10是一个严重的因素,会导致许多对生活质量产生负面影响的原因。这项研究是作为协助空气质量维持过程的第一步,以实现自然和人类生活质量的适当水平。本研究是对过去空气质量预测研究的文献综述,是第一项使用最先进的模型对PM10预测进行比较分析的研究。
 
因此,本研究评估了几种机器学习模型的比较分析,以预测科伦坡和康提两个城市地区的PM10浓度,即Battaramulla。PM10浓度水平是使用其他空气污染成分预测的,包括O3浓度,CO浓度,NO2浓度,SO2浓度、PM2.5 和气候参数,包括环境温度 (AT)、相对湿度 (RH)、太阳辐射 (SR)、降雨量 (RF)、风速 (WS) 和风向 (WD)。比较分析基于评估几个性能指标,包括平均绝对相对误差 (MARE)、均方根误差 (RMSE)、决定系数 (R2)、平均绝对误差 (MAE)、均方误差 (MSE)、相对绝对误差 (RAE)。因此,本研究增强了机器学习模型在预测 PM10 浓度方面的现有知识,并致力于斯里兰卡的应用(Mampitiya 等人,2023 年)。其结果将在政策制定中得到落实,确保城市化地区的生活水平提高。
 
本研究提出了一种开发机器学习方法来预测PM10值的方法。简而言之,本研究使用了八种机器学习模型,然后采用了一种特殊方法。考虑到所进行的文献综述,很明显,由于这项基于环境因素的研究受到许多因素的影响,因此必须采取特定的方法来。本研究提出了通过数据清理、相关性识别和使用机器学习模型进行基于循环的超参数优化,然后进行详细的比较评估的正确数据处理。由于不同地点不同因素的影响很大,因此计算了所考虑因素的Pearson相关性,以验证模型是由PM10的高度相关因素提供的。对最先进的模型进行适当的调整,可以用模型的最佳结果来丰富研究。所提出的方法,集成模型组合表明,由于ANN和Bi LSTM两个模型的组合智能,它能够在两个位置都运行良好。
[返回]

下一篇:机器学习如何帮助改善气候预测