欢迎访问一起赢论文辅导网
本站动态
联系我们
 
 
 
 
 
 
 
 
 
 
 
QQ:3949358033
微信:paperwinner
工作时间:9:00-24:00
机械论文
当前位置:首页 > 机械论文
一种用于稻谷品种分类的多尺度特征提取模型残差学习
来源:一起赢论文网     日期:2025-07-16     浏览数:559     【 字体:

 一种用于稻谷品种分类的多尺度特征提取模型残差学习

 
1. 引言
水稻是一种具有全球重要性的作物,因为它在确保粮食安全方面发挥着至关重要的作用。大米是世界上一半以上人口的重要主食,尤其是在亚洲和非洲等地区(Jabeen 等人,2023 年)。各种环境因素,如温度、湿度和土壤条件,会因地理区域而波动,从而影响水稻的质量和特性(Jin et al., 2022)。因此,准确识别不同的稻谷品种对于实现最大的作物生产力和质量至关重要。
传统上,稻谷品种的分类(Rajalakshmi et al., 2024)取决于对形态特征和籽粒特性的目视检查和评估。特征包括颜色、形状、味道和香气。农民和专业人士通常利用他们的知识和洞察力,根据这些特征区分不同的稻谷品种(Zhang et al., 2018)。然而,这种方法可能会受到个人意见的影响,并且可能需要大量时间,这可能会导致识别过程中出现错误。尽管区分稻谷品种的传统技术很重要,但它们也有一定的局限性。个人观点的影响和这些方法的劳动密集型特征强调了更准确和有效的方法的必要性,以确保全球水稻种植的一致性和生产力。
近年来,研究人员越来越关注可持续农业实践,以应对作物生产和分类方面的挑战。例如,采用黑色可生物降解覆盖物不仅可以提高作物产量,还可以减少碳排放并提高环境可持续性(Lin et al., 2024)。这些做法凸显了整合先进方法以优化作物质量和生产力,同时减轻环境影响的重要性。同样,遗传学进展,例如鉴定出调节水稻花青素生物合成的 OsTTG1 基因,强调了分子机制在改善水稻性状中的作用(Yang et al., 2021)。这些见解强调了对精确且可扩展的分类模型的需求,这些模型将传统农业实践与现代技术创新联系起来。另一位研究人员(Pan 等人,2024 年)在分类过程中利用多模态特征提取,例如化学成分、遗传标记和环境参数,这种方法能够开发更全面的模型,能够处理多模态数据以全面评估稻米质量。
已经对二元分类进行了许多文献综述;其中包括 Sun 等人,2014 年,他们建议在包含两类的数据集上使用支持向量机 (SVM) 方法,包括 1700 个与稻谷相关的数据点。该模型的分类准确率为 98.5%。使用支持向量机 (SVM) 技术对来自 16 个类别的 200 个数据点进行独立分析,准确率为 87.16%(Liu et al., 2016)。米粒的人工分类可能是一个费力且昂贵的过程,因为它主要取决于人工干预。由于评估者能力的限制,手动方法中的评估过程可能会有所不同。在机器学习和深度学习领域,通常使用人工神经网络 (ANN)、支持向量机 (SVM)、逻辑回归 (LR)、深度神经网络 (DNN) 和卷积神经网络 (CNN) 等算法对特征进行分类。这些算法已被各种研究人员研究和参考(Ebrahimi 等人,2014 年,Shrestha 等人,2016 年,Sabanci 等人,2017 年,Kaya 和 Saritas,2019 年,Cortes 和 Vapnik,1995 年,LaValley,2008 年,Dahl 等人,2013 年,Liu 等人,2017 年,Lin et al., 2018, Ahmed et al., 2020)。近年来,许多数字图像组件已被用于评估水稻的分类和卓越性。这些特性包括多种测量方法,例如长度和周长等几何尺寸、断裂率、白度以及稻粒裂纹的识别。图像处理系统可以提取粮食产品的许多特征。此外,在进行大规模评估时,快速得出结论的手动过程可能会带来困难(Patrício & Rieder 2018)。从谷类作物中获得的大米是一种广泛生产和普遍消费的食品。大米在市场上被评估和分配价值取决于许多特征。Aukkapinyo 等人(2019 年)讨论了质地、形状、颜色和断裂率等参数。在获取产品的数字图像后,使用多种机器学习算法来确定这些特征并执行分类任务。与依赖体力劳动的传统方法相比,采用图像处理的机器视觉技术具有优势(Barbedo 2016)。
此外,一些研究人员强调了注意力机制的优势,这使得模型专注于图像的不同特征。Jing et al. (2023) 提出了一种改进的 DenseNet 网络,并应用了通道注意力机制 squeeze-and-excitation 来增强内在特征。该模型的平均准确率分类为 99.4%。Stephen et al. (2023) 讨论了使用四种不同的 CNN 架构对水稻叶片进行分类,除了使用 CNN 模型进行特征提取外,自注意力机制还改进了选择过程。最后,具有自我注意功能的 ResNet34 以 98.54% 的准确率实现了最佳性能。Tang et al. (2023) 使用带有 3D 注意力模块的高光谱图像设计了一个 3D ResNet,用于提取不同的光谱特征。该模型实现了 97.47% 的总体准确率。Wang et al. (2021) 提出了一种基于 MobileNet 架构的具有贝叶斯优化的基于注意力的 Depthwise 可分离神经网络。通过不同的超参数调整、交叉验证和数据集的四类,该模型实现了 94.65% 的测试准确率。Chen et al. (2021) 提出了一个具有相关 MobileNet-V2 的轻量级注意力网络,并优化了损失函数。识别水稻植物病害的平均分类准确率为 98.48 %。
随着所有研究的进行,由于集成模型利用了单个模型的集体功能,因此在鲁棒特征提取方面存在一些限制,从而提高了整体性能和准确性,从而减轻了单个模型的弱点。另一方面,单个独立模型可能无法有效地捕获数据中的所有复杂性和模式。同样对于这个特定的数据集,注意力机制的应用也不容小觑,因为它允许模型专注于每张图像的复杂特征,从而降低了计算成本。通过将注意力模块整合到融合模型中,这些新颖的图像分类技术有可能在识别不同的稻谷品种方面产生有利的结果。这使模型能够为每个特征图通道分配修改和优化的权重,从而减少可训练参数的数量并创建轻量级模型。因此,我们被迫创建一个新的框架,将空间注意力与基于残差的学习集成模型相结合,目的是超越目前的方法并实现更有效的稻谷品种分类。本研究的目的是检查不同的稻谷品种,并开发一种使用集成学习自动识别它们的精确方法。本文提出了一种新的稻谷品种分类集成方法。这项研究的成功完成有可能使农民能够做出明智的种植决策,从而使稻谷分类过程更加简化。
本研究的重要贡献如下:
该研究采用了一种定制的注意力机制,以强调米粒图像中的重要特征。空间注意力块在第一次测试中超过了挤压和激励 (SE) 注意力,展示了模型专注于重要纹理和形状特征的能力,这些特征对于实现准确分类至关重要。
据我们所知,该研究首次引入了一种新的集成模型,该模型以协同方式有效地整合了并行滤波器网络多尺度特征提取的残差学习。这种创新方法可以更有效地提取分层特征并在多个尺度上分析特征,从而大大提高模型的分类性能。此外,与单一模型相比,双重建议的模型对这些特征的提取更加稳健。
Grad-CAM 可视化用于解释水稻谷物分类中模型的焦点区域,标志着其在这种情况下的第一个实例。这些可视化为模型的决策过程提供了清晰透明的见解,保证了学习的模式与重要的农艺特征相对应。
使用一系列全面的性能指标,例如损失、准确性、ROC-AUC、召回率、精度、敏感性、特异性和 F1 评分,来评估模型。这个全面的评估框架保证了模型的有效性在精度和可靠性的多个参数上得到严格评估。
该研究使用现有模型和已发表的文献进行了全面的比较分析。所提出的集成模型在所有参数上都表现出卓越的性能,从而为稻谷分类建立了新的基准。
本研究其余部分的结构如下:第二部分描述了材料和方法。所提出的模型架构在第二部分 III 中讨论,而第四部分讨论了实验结果。第五节概述了本研究的结论,而第六节提供了本研究的详细局限性和未来方向。
[返回]
上一篇:量化大型语言模型在科学论文中的使用
下一篇:使用安装在无人机上的传感器预测水稻产量