自深度学习在人工智能领域诞生以来,图像分类已成为一个重点研究领域。随着这项技术的发展,植物病害的鉴定已成为农业领域的一个重要关注领域[6,7],建立在图像分类的基础上。针对豆叶的病害识别和分类问题,Elfatimi, E. et al. [8] 提出了一种基于 MobileNetV2 的网络架构,并在实验中优化了超参数;结果表明,该模型能够较好地对豆叶病害进行分类。为了提高植物叶片病害的分割和识别精度,Hossain, S.M.M. et al. [9] 提出了一种基于深度可分离卷积的 DSCPLD 识别模型,实验结果表明,与其他高级模型相比,该模型具有更好的分割和识别精度。为了解决植物叶病分类的问题,Atila, Ü. et al. [10] 提出了一种基于 EfficientNet 的深度学习网络模型。结果表明,该模型在 PlantVillage 数据集上取得了更高的准确率。Mukti等[11]使用迁移学习在PlantVillage数据集上以最具成本效益的方式构建了用于植物病害鉴定的ResNet50网络模型。Ji Miamiao 等 [12] 提出了一种新的 BR-CNN 网络,这是一种基于深度学习的网络,可以同时识别植物物种和植物病害并估计植物病害的程度。为了尽量减少图像背景对图像检测的影响,Sunil, C.K. et al. [13] 提出了一种使用 EfficientNetV2 模型结合 U-2-Net 的豆类植物病害检测方法。为了最大限度地减少检测误差,Hernandez, S. et al. [14] 提出了一种基于贝叶斯和深度学习技术相结合的方法,以有效提高植物病害检测的准确性。为了解决番茄病害图像中的背景和噪声会影响番茄病害检测的问题,Albahli、Saleh等[15]提出了一种以DenseNet77为骨架的番茄病害图像检测方法。
此外,注意力机制已被纳入机器视觉,研究人员专注于通过向网络引入各种注意力机制来提高网络性能 [16-19]。为了将两张风格不同的图像合成成一张不协调或不真实的图像,Lu, Min et al. [20] 提出了一种基于改进的自注意力机制的深度学习方法来协调图像的背景和前景。针对番茄叶片病害鉴定问题,邓,Hongxia et al. [21] 提出了一种基于 GAN 网络的数据增强方法,名为 RAHC_GAN;结果表明,该方法能够生成具有病害特征的番茄叶片,提高分类精度。为了解决传统数据增强方法生成的图像中的阴影问题,Cap, Q.H. et al. [22] 提出了一种名为 LASSR 的数据增强方法;结果证明,该方法在 Cucumber 数据集中生成的图像质量更好。为了对花朵进行自动分类,Zhang, Mei et al. [23] 提出了一种基于 Xception 结构的空间注意力机制,并使用了 Triplet Loss 和 Softmax Loss 两个损失函数来提高模型的准确性,获得更高精度的花朵图像特征层。为了提高面部表情识别的准确性,Li, Jing et al. [24] 构建了一个新的面部表情数据集,并提出了一种基于 LBP 特征和注意力机制的深度学习网络方法;在新数据集和其他 4 个数据集上的实验证明了有效性