• 美文
  • 文章
  • 散文
  • 日记
  • 诗歌
  • 小说
  • 故事
  • 句子
  • 作文
  • 签名
  • 祝福语
  • 情书
  • 范文
  • 读后感
  • 文学百科
  • 当前位置: 柠檬阅读网 > 范文 > 正文

    基于EEMD-LSTM模型的禽霍乱预测研究

    时间:2023-01-26 14:30:07 来源:柠檬阅读网 本文已影响 柠檬阅读网手机站

    何振欢,肖建华

    (东北农业大学 动物医学学院 黑龙江省普通高等学校动物普通疾病防治重点实验室 黑龙江,哈尔滨 150030)

    禽霍乱(Fowl cholera)是一种由多杀性巴氏杆菌引起的接触性、败血性传染病,鸡、鸭和鹅等禽类均易感[1]。禽霍乱是世界范围内家禽的主要疫病之一,具有较高的发病率和死亡率,给禽养殖业造成了巨大的经济损失[2-3]。我国目前仍广泛应用弱毒疫苗和灭活疫苗预防禽霍乱,但弱毒疫苗副作用大、免疫期偏短,灭活疫苗除免疫期短外,还存在保护率低等问题[4]。禽类接种弱毒疫苗和灭活疫苗后,仍存在患病的风险。因此,进行禽霍乱疫病的监测,对于该病的防控具有重要的现实意义。

    机器学习是一门通过识别和利用现有知识获取新知识的多领域交叉学科,其可通过学习已有数据建立模型,并对未来数据进行分析和预测[5]。其中,长短期记忆模型(LSTM)由于具有较好的预测性能,近年来被广泛应用于传染性疾病的预测[6-8]。LSTM模型可通过识别和学习疾病的已有数据,预测疾病未来的发展趋势[9]。集合经验模态分解是一种基于经验模态分解(empirical mode decomposition,EMD)提出的新算法,其目的是将原始数据分解为有限个固有模态函数(intrinsic mode function,IMF)和一个残差(residual),以识别共存的振荡模式,克服EMD算法的模态混叠问题[10-11]。EEMD可从原始时间序列中提取简单的周期信号,将这些信号用作机器学习模型的输入,可显著提高模型的预测性能。近年来,EEMD已广泛应用于传染性疾病的预测研究[12-13]。Tiago等利用EEMD-ARIMAX组合模型和ARIMAX模型进行了巴西新冠肺炎病例数的预测研究,研究结果表明,EEMD-ARIMAX组合模型的预测性能优于单一ARIMAX模型的预测性能[13]。

    综上所述,应用机器学习模型预测人类传染病的发病趋势已成为国际上的研究热点,而在动物传染病领域的研究较少。本研究在前人研究的基础上,构建了一种以EEMD为分解模型,LSTM为预测模型的EEMD-LSTM组合模型,应用禽霍乱的发病数据分析模型的预测性能,以期为禽霍乱的有效防控,以及为该模型的其他应用研究提供理论依据。

    1.1 禽霍乱发病数据的获取

    禽霍乱的发病数据来自中国农业农村部《兽医公报》(http://www.moa.gov.cn/gk/sygb/)。将收集到的我国2006年1月至2020年12月禽霍乱的发病数据按照时间顺序进行排列。应用Microsoft Excel 2016统计分析软件对我国2006年1月至2020年12月各省市禽霍乱的发病情况进行分析,研究结果显示,2006年-2020年间,湖北省禽霍乱的发病数最多(图1)。由于湖北省禽霍乱的发病数据最多,连续性较强,因此,利用湖北省的禽霍乱数据进行模型预测性能分析。

    图1 2006年~2020年我国禽霍乱发病情况

    1.2 EEMD-LSTM模型的建立

    利用MATLAB 2020b软件构建EEMD-LSTM模型。将2006年湖北省的禽霍乱发病数据作为模型的初始化输入,进行模型的初步构建。

    1.3 EEMD-LSTM模型的训练及可信度分析

    利用湖北省2006年-2015年的禽霍乱发病数据训练模型。训练模型时,禽霍乱的发病数据首先经EEMD分解为6个固有模态函数和1个残差,然后将分解后的数据输入到LSTM模型当中,每次训练后,在可视化窗口可观察到模型预测发病数与实际发病数的拟合情况,当预测发病数与实际发病数达到最佳拟合时,终止训练,将模型训练期的预测发病数导出,利用Microsoft Excel 2016和SPSS 22.0软件分别计算预测发病数和实际发病数的线性回归分析R2值和组内相关系数ICC值,分析模型的可信度。ICC是Bartko提出的一种衡量可信度的方法[14],后发展成为评估预测值与实际值之间一致性的方法[15]。ICC取值范围为[0,1],当ICC值大于0.75时,预测结果具有较好的可信度[16]。最后将训练期可信度最佳的模型用于禽霍乱发病趋势的预测。

    1.4 EEMD-LSTM模型的预测及可信度分析

    应用训练好的EEMD-LSTM模型预测湖北省2016年-2020年禽霍乱的发病数,然后与实际发病数比较进行验证,最后应用Microsoft Excel 2016和SPSS 22.0软件分别计算线性回归系数R2值及组内相关系数ICC值,衡量预测发病数与实际发病数的一致性,分析模型的可信度。

    2.1 EEMD-LSTM模型的训练及可信度分析结果

    2.1.1 EEMD模型训练期的分解结果 训练模型时,首先利用EEMD模型将湖北省2006年-2015年禽霍乱的发病数据分解为6个个固有模态函数和1个残差。当模型终止训练时,将EEMD分解数据导出,然后应用GraphPad Prism 8.0.2软件进行分解结果可视化分析。结果显示,经EEMD分解后的禽霍乱时序数据的趋势逐渐趋于平稳,并且其信号周期更为简单(图2)。

    图2 EEMD分解结果

    2.1.2 EEMD-LSTM模型训练期的预测结果 利用2006年-2015年禽霍乱的发病数训练模型,每一次训练结束后,可通过模型的可视化窗口观察模型训练期的预测发病数与实际发病数的拟合情况,当实际发病数与预测发病数达到最佳拟合时,终止模型的训练。将模型训练期的预测发病数从模型中导出,应用GraphPad Prism 8.0.2将实际发病数与预测发病数进行可视化拟合。结果显示,在EEMD-LSTM模型的训练期间,预测发病数与实际发病数拟合结果良好(图3),表明该组合模型能够较准确的预测禽霍乱的发病趋势。

    图3 EEMD-LSTM模型训练期禽霍乱实际发病数与预测发病数拟合结果

    2.1.3 EEMD-LSTM模型训练期的可信度分析结果 将模型训练期的最佳预测发病数与实际发病数拟合结果导出,应用Microsoft Excel 2016和SPSS 22.0软件分别计算预测发病数与实际发病数的线性回归系数R2值和组内相关系数ICC值,分析模型的可信度。结果显示,线性回归系数R2值为0.993 5,ICC值为0.997,其ICC值大于0.75并接近于1(图4),表明该组合模型具有较高的可信度,可用于预测禽霍乱未来的发病趋势。

    图4 模型训练期ICC分析结果

    2.2 EEMD-LSTM模型的预测及可信度分析结果

    2.2.1 EEMD-LSTM模型预测期的预测结果 应用训练好的EEMD-LSTM模型预测2016年-2020年禽霍乱的发病数,将模型预测期的预测发病数从模型中导出,应用GraphPad Prism 8.0.2将实际发病数与预测发病数进行可视化拟合。结果显示,禽霍乱预测发病数与实际发病数拟合结果良好(图5),表明该组合模型能够较为准确的预测禽霍乱的发病趋势。

    图5 EEMD-LSTM模型预测期禽霍乱实际发病数与预测发病数拟合结果

    2.2.2 EEMD-LSTM模型预测期的可信度分析结果 应用训练好的EEMD-LSTM模型预测2016年-2020年禽霍乱的发病数,将模型预测期的预测发病数从模型中导出,应用Microsoft Excel 2016和SPSS 22.0软件分别计算预测发病数与实际发病数的线性回归系数R2值和组内相关系数ICC值,分析模型的可信度。结果显示,线性回归系数R2值为0.750 7,ICC值为0.825,其ICC值大于0.75(图6),表明该组合模型的预测结果具有较高的可信度。

    图6 模型预测期ICC分析结果

    禽霍乱被我国列为二类动物疫病,该病是我国《兽医公报》中发病数据最多的家禽传染病,严重危害家禽健康[17]。目前,国内外主要应用机器学习模型进行人类传染病的预测研究,而在动物床染病领域的研究较少。韩天齐等[18]应用1950年-2014年麻疹的发病率构建LSTM神经网络,并应用构建好的LSTM模型预测未来5年麻疹发病率的趋势。Chimmula等[6]构建LSTM模型对加拿大新冠肺炎病例数进行了预测研究。Shastri等[19]构建并应用LSTM模型预测印度和美国新冠肺炎的病例数。

    禽霍乱的传播受交通运输、贸易和饲养管理等因素影响[20]。而本研究使用的时间序列分析法是在已知疾病数据的基础上去预测未来疾病的发展趋势,该方法假定预测对象的变化与时间变化有关,克服了无法收集疫病复杂影响因素的困难[21]。在本研究中,应用MATLAB 2020b软件构建EEMD-LSTM模型后,首先对模型进行训练,在训练模型时,禽霍乱的发病数据经EEMD分解为6个固有模态函数IMF和1个残差Residual(图2),其分解后的序列周期性简单,易于模型的识别和学习。然后对模型终止训练时的预测发病数与实际发病数进行验证(图3),并计算实际发病数与预测发病数的线性回归系数R2值和组内相关系数ICC值(图4),分析训练期模型的可信度。最后应用训练好的EEMD-LSTM模型进行禽霍乱的预测,并将实际发病数与预测发病数进行验证,发现其拟合结果良好(图5),并计算模型预测期的实际发病数与预测发病数的线性回归系数R2值和组内相关系数ICC值(图6),分析预测期模型的可信度,高翔等[17,22]应用该方法分析模型预测的猪巴氏杆菌病预测发病数与实际发病数的一致性,说明该方法具有一定的可信度。

    本研究结果显示,模型训练期禽霍乱的实际发病数与预测发病数的R2和ICC值分别为0.993 5和0.997,其ICC值大于0.75并接近于1,表明该组合模型具有良好的预测能力,可用于预测未来禽霍乱的发病趋势。模型预测期的禽霍乱实际发病数与预测发病数的R2和ICC值分别为0.7505和0.825,其ICC值大于0.75,同时大于Landis和Koch的建议值0.80[15],进一步说明该组合模型具有较高的可信度。

    本研究结果表明,应用EEMD-LSTM模型能够较为准确的预测未来禽霍乱的发病趋势,并且该组合模型的预测结果具有较高的可信度,可为禽霍乱的防控提供参考,同时也为该模型的其他应用研究提供理论依据。

    猜你喜欢 回归系数模态预测 基于BERT-VGG16的多模态情感分析模型成都信息工程大学学报(2022年4期)2022-11-18无可预测黄河之声(2022年10期)2022-09-27选修2-2期中考试预测卷(A卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2-2期中考试预测卷(B卷)中学生数理化(高中版.高二数学)(2022年4期)2022-05-25选修2—2期中考试预测卷(A卷)中学生数理化·高二版(2022年4期)2022-05-09多模态超声监测DBD移植肾的临床应用昆明医科大学学报(2022年3期)2022-04-19跨模态通信理论及关键技术初探中国传媒大学学报(自然科学版)(2021年1期)2021-06-09基于生产函数模型的地区经济发展影响因素分析现代商贸工业(2017年30期)2018-01-22电导法协同Logistic方程进行6种苹果砧木抗寒性的比较江苏农业科学(2017年10期)2017-07-21电导法协同Logistic方程进行6种苹果砧木抗寒性的比较江苏农业科学(2017年10期)2017-07-21
    相关热词搜索: 霍乱 模型 预测

    • 文学百科
    • 故事大全
    • 优美句子
    • 范文
    • 美文
    • 散文
    • 小说文章