这是用户在 2025-1-6 21:07 为 https://app.immersivetranslate.com/pdf-pro/6019fcf1-7c88-4133-9df4-f69a205fac83 保存的双语快照页面,由 沉浸式翻译 提供双语支持。了解如何保存?
  


一种基于深度学习的改进通道注意力机制 aECAnet 的植物病害有效图像分类方法


Wenqiang Yang, Ying Yuan, Donghua Zhang, Liyuan Zheng 和 Fuquan Nie *

河南科学技术学院,中国 新乡453003;yangwqjsj@163.com (W.Y.);15237613225@163.com (Y.Y.);zdh18439027037@163.com (D.Z.);zhliy0711@163.com (L.Z.)

* 对应方式:lyylnyx@sina.com


引自:Yang, W.;袁 Y.;张 D.;郑 L.;聂 F.一种基于深度学习的改进通道注意力机制 aECAnet 的植物病害有效图像分类方法。对称 2024, 16, 451。https://doi.org/10.3390/ sym16040451

学术编辑:Michel Planat 和 Changxin Gao
  收稿日期: 2024-03-10
  修订日期:2024 年 3 月 31 日
  录用日期: 2024-04-1
  出版日期:2024 年 4 月 8 日

  抽象


由于植物生长过程中发生的病害是导致产量和质量下降的重要因素,因此对植物叶子病害进行分类和检测,并及时采取防控措施,对于保障植物的生产力和质量至关重要。针对传统的卷积神经网络结构无法有效识别相似植物叶片病害的问题,为了更准确地识别植物叶片上的病害,本文提出了一种有效的植物病害图像识别方法 aECA-ResNet34。该方法基于 ResNet34,在该网络的第一层和最后一层,分别添加了本文改进的具有对称结构的 aECAnet。将 aECA-ResNet34 与本文构建的花生数据集和开源 PlantVillage 数据集上的不同植物病害分类模型进行了比较。实验结果表明,本文提出的 aECA-ResNet34 模型具有更高的精度、更好的性能和更好的鲁棒性。结果表明,本文提出的 aECA-ResNet34 模型能够非常准确地识别多种植物叶片的病害。


关键词:图像分类;深度学习;注意力机制;植物病害;卷积神经网络

  1. 引言


农业是一个关键行业,对一个国家的经济发展和人民的生活水平有重大影响 [1]。然而,该行业的生产力经常受到害虫、细菌和真菌病毒的持续威胁的阻碍,这些病毒会对重要作物产生不利影响。提高农业生产力的障碍是巨大的,需要采取积极措施来减轻这些挑战的影响。为了保护植物健康,需要专注于加强对影响植物叶片的病虫害的预防和治疗 [2]。深度学习技术与农业领域的整合彻底改变了植物叶部病害的识别,使其成为诊断和控制植物病害 [3] 和确保作物安全的最重要工具之一。虽然传统的卷积神经网络 (CNN) [4] 模型通过提取全局特征来识别一些易于区分的植物病害类型非常有效,但它们在处理各种相似的植物病害物种时面临着重大挑战。如图 1 所示,传统 CNN 模型仅提取全局特征的能力有限,因此很难区分相似的病叶或类似的健康植物叶 [5]。图 1a 显示不同的植物具有相似的叶子,图 1b 显示不同的疾病具有相似的症状。为了克服这一挑战,提取局部特征已成为区分不同植物叶片的重要手段,而高效、准确地提取局部特征是本研究的核心重点。


图 1.相似的叶子。


自深度学习在人工智能领域诞生以来,图像分类已成为一个重点研究领域。随着这项技术的发展,植物病害的鉴定已成为农业领域的一个重要关注领域[6,7],建立在图像分类的基础上。针对豆叶的病害识别和分类问题,Elfatimi, E. et al. [8] 提出了一种基于 MobileNetV2 的网络架构,并在实验中优化了超参数;结果表明,该模型能够较好地对豆叶病害进行分类。为了提高植物叶片病害的分割和识别精度,Hossain, S.M.M. et al. [9] 提出了一种基于深度可分离卷积的 DSCPLD 识别模型,实验结果表明,与其他高级模型相比,该模型具有更好的分割和识别精度。为了解决植物叶病分类的问题,Atila, Ü. et al. [10] 提出了一种基于 EfficientNet 的深度学习网络模型。结果表明,该模型在 PlantVillage 数据集上取得了更高的准确率。Mukti等[11]使用迁移学习在PlantVillage数据集上以最具成本效益的方式构建了用于植物病害鉴定的ResNet50网络模型。Ji Miamiao 等 [12] 提出了一种新的 BR-CNN 网络,这是一种基于深度学习的网络,可以同时识别植物物种和植物病害并估计植物病害的程度。为了尽量减少图像背景对图像检测的影响,Sunil, C.K. et al. [13] 提出了一种使用 EfficientNetV2 模型结合 U-2-Net 的豆类植物病害检测方法。为了最大限度地减少检测误差,Hernandez, S. et al. [14] 提出了一种基于贝叶斯和深度学习技术相结合的方法,以有效提高植物病害检测的准确性。为了解决番茄病害图像中的背景和噪声会影响番茄病害检测的问题,Albahli、Saleh等[15]提出了一种以DenseNet77为骨架的番茄病害图像检测方法。

此外,注意力机制已被纳入机器视觉,研究人员专注于通过向网络引入各种注意力机制来提高网络性能 [16-19]。为了将两张风格不同的图像合成成一张不协调或不真实的图像,Lu, Min et al. [20] 提出了一种基于改进的自注意力机制的深度学习方法来协调图像的背景和前景。针对番茄叶片病害鉴定问题,邓,Hongxia et al. [21] 提出了一种基于 GAN 网络的数据增强方法,名为 RAHC_GAN;结果表明,该方法能够生成具有病害特征的番茄叶片,提高分类精度。为了解决传统数据增强方法生成的图像中的阴影问题,Cap, Q.H. et al. [22] 提出了一种名为 LASSR 的数据增强方法;结果证明,该方法在 Cucumber 数据集中生成的图像质量更好。为了对花朵进行自动分类,Zhang, Mei et al. [23] 提出了一种基于 Xception 结构的空间注意力机制,并使用了 Triplet Loss 和 Softmax Loss 两个损失函数来提高模型的准确性,获得更高精度的花朵图像特征层。为了提高面部表情识别的准确性,Li, Jing et al. [24] 构建了一个新的面部表情数据集,并提出了一种基于 LBP 特征和注意力机制的深度学习网络方法;在新数据集和其他 4 个数据集上的实验证明了有效性


的方法。为了提高植物病害识别的准确性,Alirezazadeh、Pendar等[25]提出了一种将CBAM注意力机制与CNN相结合的方法,并在两个数据集上进行了实验;结果证明,结合 CBAM 注意力机制和 EfficientNetB0 网络的模型在识别植物叶部病害方面具有最高的准确性。

尽管注意力机制在主要领域发挥了很大作用,但仍然存在模型精度不足、植物病虫害局部特征提取困难等问题和病害识别与控制。因此,本文提出了一种改进的通道注意力机制,称为 aECAnet,与传统的 CNN ResNet34 相结合,用于识别植物叶片病害的图像。这项研究的主要贡献可以归纳为三个方面:


(1)本文提出了一种改进的通道注意力 aECAnet,证明了其在提取植物叶片图像局部特征方面的有效性;


(2) 开发了一种名为 aECA-ResNet34 的新型网络架构,它将 ResNet34 与 aECAnet 相结合以提高性能;


(3) 对 aECA-ResNet34 与 SENet 和 ECAnet 等其他注意力模块进行了比较分析。一系列实验证明了与其他模型相比,所提出的 aECAnet 在识别相似植物物种和相似疾病症状方面的有效性。


2. 卷积神经网络模型


本研究的目的是构建一个深度 CNN 模型,该模型可以有效提取局部特征并表现出高鲁棒性,以准确识别植物病害图像。在本节中,将详细描述深度 CNN ResNet34 的结构、通道注意力网络 aECAnet 的结构,以及如何将两者结合起来的过程。

  2.1. 一般框架


为了提取植物叶片的局部特征,引入了注意力机制,两者相结合提高了植物叶片病虫害分类的准确性。网络架构如图 2 所示,可以看出它包含 ResNet34 和改进的通道注意力机制 aECA-Attention 网络。从图 2 中可以看出,蓝色矩形块代表卷积块,灰色矩形块代表 Relu 激活函数,菱形模块代表改进的 aECA-Attention 网络模块。首先输入花生叶图像,通过一系列卷积提取其全局特征[26],在ResNet34中加入aECA-Attention模块提取局部特征,然后通过Global Max Pooling提取特征纹理,以减少无用信息的影响,最后通过Softmax函数输出该图像的分类结果。


图 2.aECA-ResNet34 的一般框架。


  1. 版权所有:©作者 2024 年。被许可人 MDPI,瑞士巴塞尔。本文是根据知识共享署名 (CC BY) 许可证 (https:// creativecommons.org/licenses/by/ 4.0/) 的条款和条件分发的开放获取文章。