• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于改进麻雀搜索算法的空气质量指数预测*

    时间:2023-01-19 18:35:17 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    胡 青,龚世才**,胡 珍

    (1.浙江科技学院理学院,浙江杭州 310000;
    2.湖北工业大学理学院,湖北武汉 430068)

    近年来,随着我国工业化进程不断加快,经济迅猛发展,人口不断增长,空气污染问题已经引起全社会的关注[1]。建立空气质量预测模型对城市环境治理工作有着重要作用,不仅有助于减轻大气污染对人体的伤害,还能为环保部门准确预测空气质量提供科学的方法[2]。

    空气质量指数(Air Quality Index,AQI)的传统预测方法有时间序列模型、数理统计模型、线性回归模型、灰色预测方法等[3,4]。天气、大气污染物等因素对空气质量具有较大影响,导致空气质量具有明显的非线性、不确定性等特征。因此,传统的预测方法很难得到精确的预测结果[5]。由于神经网络具有较强的非线性拟合能力,可以较好地完成对AQI的预测。王国胜等[6]采用BP神经网络模型对AQI进行预测,结果相较于传统统计方法,虽然得到了更高的预测精度,但是单一BP神经网络收敛速度慢且易陷入局部最优解。为了进一步提高预测精度,有学者利用智能优化算法对其进行优化,如张旭等[7]利用粒子群算法(Particle Swarm Optimization,PSO)优化BP神经网络,提升了模型的泛化能力,在空气质量指数预测中取得较好效果。杨云等[8]利用遗传算法(Genetic Algorithm,GA)对BP神经网络进行改进,建立空气质量指数预测模型,提升了BP神经网络的性能,预测结果有更高的精度。综上所述,传统的单一BP神经网络模型的AQI预测效果较差,尽管有些学者利用传统优化算法优化模型,在一定程度上解决了预测精度的问题,但在算法迭代后期仍存在易陷入局部最优、收敛速度慢的缺点。

    为解决上述问题,本研究利用改进麻雀搜索算法(Improved Sparrow Search Algorithm,ISSA),对BP神经网络进行训练,以期得到预测精度高、全局搜索能力强的ISSA-BP模型。该模型的主要思路是利用麻雀搜索算法(Sparrow Search Algorithm,SSA)相较于传统优化算法具有收敛速度快、寻优精度高的优点[9],对BP神经网络的权值及阈值进行优化,同时考虑到SSA在迭代后期,存在种群多样性减少、收敛速度慢以及全局搜索能力弱的缺陷[10],通过引入立方映射提高初始解的质量,增加初始化麻雀种群的多样性,从而提升算法的收敛能力,同时结合优化策略增强算法的全局搜索能力。使用ISSA-BP模型对杭州市空气质量指数值进行预测,检验该模型的实际应用效果。

    麻雀搜索算法是模拟麻雀搜索食物过程的一种新型智能算法[11],通过比较适应度值,不断更新种群中麻雀个体的位置。

    在SSA中,发现者搜索范围广,负责引导种群搜索和觅食,发现者的位置更新公式如下:

    (1)

    跟随者会跟随发现者进行觅食以获得更好的适应度,其位置更新公式如下:

    (2)

    在麻雀觅食的同时会在种群中随机选取一定比例的个体作为警戒者进行侦查预警,其位置更新公式如下:

    (3)

    2.1 立方映射初始化种群

    麻雀搜索算法对种群进行初始化时,采用的是随机生成的方式,这种方式会使得麻雀种群分布不均匀,影响后期的迭代寻优。为提高算法全局搜索能力,避免迭代后期种群多样性降低,同时考虑到混沌映射具有随机性、遍历性和规律性等特点[12,13],利用混沌序列对种群进行初始化。汤安迪等[14]证明了立方映射的均匀性及遍历性优于经典的Logistic映射,故本研究采用立方映射完成种群的初始化。立方映射公式如下:

    y(n+1)=4y(n)3-3y(n),

    (4)

    式(4)中,n为映射次数,y(n)∈(-1,0)∪(0,1),

    y(n)为第n次映射值。

    为防止通过立方映射产生的值超过BP神经网络的权值及阈值优化范围,利用式(5)将映射值调整到统一区间:

    Xi=Xlb+0.5(Xlb-Xub)(yi+1),

    (5)

    式(5)中,Xlb、Xub分别为麻雀种群中个体所处维度的上、下边界;
    Xi为麻雀个体实际位置值。

    立方映射初始化麻雀种群的步骤如下:

    步骤1 设置种群规模N、维数d、初始值y0。

    步骤2 根据式(4)进行迭代计算,产生序列y,序列y中每个d维向量作为一个麻雀个体。

    步骤3 根据式(5)对越界值进行处理,使得每个d维向量的值变化区间是[-1,1]。

    假设种群规模为30,在二维搜索空间中产生的初始化种群分布如图1和图2所示,从图中可以看出,相比随机初始化的种群序列,通过立方映射产生的初始种群分布更加均匀,遍历性更好。

    图1 随机初始化种群

    图2 立方映射初始化种群

    2.2 蝴蝶优化策略

    蝴蝶优化算法(Butterfly Optimization Algorithm,BOA)是受到蝴蝶觅食和求偶过程所启发的群智能算法[15]。在迭代时,蝴蝶将朝着气味最浓的方向移动,该阶段被称为全局搜索阶段。其位置更新方式如下:

    (6)

    由式(1)可知,当R

    (7)

    对改进前后的公式分别进行迭代,得到麻雀种群中个体的分布如图3和图4所示。从图中可以看出,改进后的策略在迭代后期保证了麻雀种群个体分布的多样性,在提高收敛速度的同时,在一定程度上扩大了搜索空间,提升了算法的全局寻优能力。

    图3 改进前发现者搜索策略

    图4 改进后发现者搜索策略

    2.3 正余弦搜索策略

    根据式(2)可知,跟随者在向发现者最优位置靠近时,会导致种群个体短时间聚集,虽然提高了算法的收敛速度,但是易出现算法陷入局部最优。正余弦函数不仅易于实现,而且有着良好的收敛性。利用其振荡特性进行寻优可以降低算法易陷入局部最优解的风险。改进后跟随者的位置更新公式如下:

    (8)

    (9)

    式(8)(9)中:a为大于1的常数,本研究中的a取2;
    S1、S2、S3、S4均为服从均匀分布的随机数;
    S2∈(0,2π)、S3∈(0,2)、S4∈(0,1);
    tmax为最大迭代次数。

    2.4 高斯扰动策略

    高斯分布在局部空间搜索性能好,对全局最优个体使用高斯扰动有利于算法跳出局部极值点,同时也增强了算法全局搜索性能。使用高斯扰动策略生成新个体的公式如下:

    (10)

    2.5 算法性能测试

    2.5.1 算法初始化参数设置

    为了验证ISSA的寻优效果与稳定性,本研究选取遗传算法(Genetic Algorithm,GA)[16]、粒子群算法(Particle Swarm Optimization,PSO)[17]、SSA以及ISSA进行寻优结果的对比,同时为了保持所有初始种群分布的均匀性与多样性,随机产生的每维取值范围均是[-1,1]的30维向量y0,作为种群的第一个个体,后续种群个体利用上述立方映射公式进行种群初始化。设置种群中的边界范围为[-3,3],通过上述立方映射的边界值处理公式将种群中所有个体的取值范围统一为[-1,1],其中所有算法的种群数量设置为30,最大迭代次数为1 000。

    2.5.2 测试函数选取

    为了进一步验证ISSA的寻优性能,采用8个具有不同特征的基准测试函数进行测试。其中,F1-F5是单峰函数,F6-F8是多峰函数,测试函数维度为30,寻优的最优值为0,8个基准测试函数及其具体信息如表1所示。

    表1 基准测试函数

    2.5.3 算法寻优能力分析

    为了去除偶然性带来的误差,分别利用上述4种算法对8个测试函数进行30次独立试验,以0.01为取值间隔,通过参数值在对应取值范围内的不断遍历,选取30次最优值的平均值作为算法的寻优结果,选取历史最优值对应的算法参数值作为算法参数的最佳取值。算法的最佳参数值及测试函数的寻优结果分别如表2和表3所示。

    表2 算法最佳参数值

    表3 测试函数寻优结果

    由表3可知,ISSA对于单峰函数F1-F3的优化效果非常明显,其寻优的指标值远超其他算法,而对于单峰测试函数F4-F5,虽然ISSA的改进效果略优于SSA,但其改进效果要明显优于GA与PSO,对于多峰函数F8,ISSA的寻优效果与SSA差别不大,但寻优效果优于GA与PSO十几个数量级。不论是单峰函数还是多峰函数,ISSA在多次寻优的过程中,平均值和标准差均比其他算法更小,表明ISSA拥有更好的全局搜索能力。

    2.5.4 算法收敛能力分析

    通过绘制基准测试函数迭代进化曲线,可进一步对比分析各个算法的收敛能力,从而更加精准地评判其预测性能,图5-12为所有算法迭代1 000次后的进化曲线图。

    由图5-12可知,相比于其他几种算法,一方面,ISSA迭代更少次数进入相同精度,表明了引入的立方映射提高了初始解的质量,使得种群分布更加均匀;
    另一方面,当算法的寻优值存在不同程度的停滞时,ISSA的寻优值呈现出波动下降,表明优化策略对算法的改进使得算法有能力跳出局部极值,在全局空间内搜索最优解。以上改进均有效提高了ISSA的收敛速度,使得ISSA相较于其他的算法拥有更强的收敛能力。

    图5 F1进化曲线

    图6 F2进化曲线

    图8 F4进化曲线

    图9 F5进化曲线

    图10 F6进化曲线

    图11 F7进化曲线

    图12 F8进化曲线

    3.1 BP神经网络原理

    BP神经网络是一种采用误差反向传播算法进行学习的多层前馈网络[18,19],其结构包括输入层、隐含层、输出层。BP神经网络的拓扑结构如图13所示。

    图13 BP神经网络拓扑结构

    3.2 ISSA-BP模型原理

    ISSA-BP模型的主要思想是利用改进后的麻雀搜索算法取代梯度下降法在全局范围内对BP神经网络中的权值和阈值进行大范围搜索,通过适应度值的更新不断调整训练误差。本模型将测试集中的均方误差作为适应度函数值。迭代完成后通过解码形成最优权值及阈值,同时结合改进后算法收敛速度快、泛化能力强的特点对BP神经网络进行训练,最后得到预测性能更好的神经网络模型。ISSA-BP模型的流程图如图14所示。

    图14 ISSA-BP模型流程图

    4.1 数据采集与预处理

    本研究数据是从中华人民共和国生态环境部网站(https://www.mee.gov.cn)实时监测的杭州市空气质量数据中获取的,采样时间为2020年9月1日至2022年1月13日,共计500组样本数据。训练集为随机选取的450组数据,测试集为剩余的50组数据。将PM2.5、PM10、SO2、CO、NO2、O3纳入预测体系中,作为输入变量对AQI进行预测。

    由于数据的单位或数量级的不同,可能导致收敛速度变慢、训练时间变长等问题。因此,要对样本数据进行归一化处理,归一化公式如下:

    (11)

    4.2 BP神经网络结构

    BP神经网络结构的确定是数据输入以及网络训练的关键,BP神经网络结构包括输入层、输出层以及隐含层3个部分。其中,输入层为6个节点,输出层为1个节点,隐含层节点数是决定BP神经网络预测精度的重要因素[20],神经网络中确定隐含层的神经元数量通常使用经验公式(12)进行计算。

    (12)

    式(12)中,q为隐含层的节点个数,m为输入层的节点个数,n为输出层的节点个数,a的取值为1-10的常数。

    通过不断改变隐含层神经元数目,并代入神经网络训练,得到的均方误差见表4。由表4可知,当隐含层节点数为9时,均方误差最小,因此,本研究选择的隐含层节点数为9。由此可得训练的网络结构为6-9-1。

    表4 隐含层节点个数对应的均方误差

    4.3 仿真实验及结果分析

    为检验ISSA-BP模型的性能,分别用BP神经网络、遗传算法优化的BP神经网络(GA-BP)、粒子群算法优化的BP神经网络(PSO-BP)、麻雀搜索算法优化的BP神经网络(SSA-BP)作为对照模型进行仿真实验。本研究利用MATLAB进行预测仿真,5种模型的仿真预测结果如图15所示。

    图15 模型仿真预测结果

    由仿真结果可知,ISSA-BP模型的预测曲线的拟合程度高于其他4种模型,预测值更加接近真实值,因此,ISSA-BP模型对AQI的预测更加精准。为了对所建立的空气预测模型的性能进行全面而系统的分析,本研究选取均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、拟合优度(R2)作为模型优越性的衡量指标。计算公式如下:

    (13)

    (14)

    (15)

    (16)

    利用训练好的模型测试AQI,得到5种预测模型性能的评价结果如表5所示。由表5可知,经过相关算法优化后的组合模型的预测效果明显优于单一的BP神经网络模型。其中,在组合模型中,ISSA-BP模型的RMSE、MAE、MAPE数值最小。相比于BP、GA-BP、PSO-BP、SSA-BP模型,ISSA-BP模型的RMSE分别降低了70.8%、50.2%、45.2%、34.6%,MAE分别降低了74.6%、57.9%、54.2%、43.3%,MAPE分别降低了68.2%、53.1%、49.1%、25.2%。决定系数R2为0.99,最接近1,拟合程度最优。因此,本研究提出的ISSA-BP模型的预测精度最好,预测误差最小,能够有效地应用于空气质量指数的预测中。

    表5 预测模型性能评价结果

    本研究提出了一种改进的麻雀搜索算法(ISSA),并基于BP神经网络构建了AQI预测模型(ISSA-BP)。通过改进后的麻雀搜索算法来优化BP神经网络权值及阈值,与未优化的BP神经网络相比,显著提升了其预测精度,可有效预测AQI。所建立的ISSA-BP模型不仅解决了传统BP神经网络在预测AQI方面的不足,更弥补了利用麻雀搜索算法在优化模型时的缺陷。下一步研究重点是将ISSA-BP模型应用到实际工程领域中,以进一步验证其性能。

    猜你喜欢 测试函数搜索算法空气质量 乌海市雾对空气质量的影响农业灾害研究(2022年2期)2022-05-31一种基于分层前探回溯搜索算法的合环回路拓扑分析方法现代电力(2022年2期)2022-05-23解信赖域子问题的多折线算法太原科技大学学报(2022年1期)2022-02-24一种基于精英选择和反向学习的分布估计算法计算机仿真(2021年1期)2021-11-18改进的非结构化对等网络动态搜索算法军民两用技术与产品(2021年2期)2021-04-13改进的和声搜索算法求解凸二次规划及线性规划烟台大学学报(自然科学与工程版)(2021年1期)2021-03-19基于自适应调整权重和搜索策略的鲸鱼优化算法东北大学学报(自然科学版)(2020年1期)2020-02-15基于莱维飞行的乌鸦搜索算法智能计算机与应用(2018年3期)2018-09-05具有收缩因子的自适应鸽群算法用于函数优化问题物联网技术(2017年5期)2017-06-03车内空气质量标准进展汽车与安全(2016年5期)2016-12-01
    相关热词搜索: 空气质量 麻雀 算法

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章