Automatic Grouping Method of Flue-cured Tobacco Based on MobileViT
-
摘要:
针对烟叶自动识别分组过程中特征提取困难、分组准确率低、模型参数量大、部署困难等问题,本文结合轻量化网络MobileNetV2与ViT模型的优点提出了一种轻量化MobileViT模型的烤烟自动分组方法。首先对所采集的烟叶图像进行前景和背景的预处理,解决提取烟叶特征困难的问题;然后将预处理后的图像建立成完整的烟叶图像数据集;最后针对建立的数据集使用基于轻量化MobileViT模型进行分组。使用该模型对云南省多地收购的5871张混合烤烟叶片进行分组试验,结果表明MobileViT对正组烟叶、副组烟叶和正副混合组烟叶分组准确率分别达到了79.44%、83.83%、79.22%,与MobileNetV2相比分别提升了9.5%、17.66%、17.56%;与ViT模型相比分别提升了13.8%、30.83%、34.12%。与当前应用较多的MobileNetV3、Effcient、Resnet50三种模型相比,MobileViT模型在混合组上分组准确率较轻量化MobileNetV3网络提升了11.86%;较CNN为代表的Effcient、Resnet50模型分别提升了9.6%、6.55%,模型大小降低了24.62%、79.1%。轻量化MobileViT模型同时结合了轻量化网络MobileNetV2与ViT模型的优点,在降低模型大小的同时具有较高的分组准确率,更容易部署在工业设备中,符合实际工业应用需求。
-
关键词:
- 烤烟自动分组 /
- 轻量化 /
- MobileViT模型
Abstract:Aiming for solving the problems of difficult feature extraction, low grouping accuracy, large number of model parameters and difficult deployment in automatic tobacco leaf identification and grouping process, an automatic tobacco grouping method based on the advantages of lightweight network MobileNetV2 and ViT model was developed in this study. First, pre-processing of the foreground and background of the acquired tobacco leaf images was conducted to solve the problem of extracting tobacco leaf features; And a complete tobacco leaf image data set was established based on the preprocessed image; Finally, the established data sets were grouped using a lightweight MobileViT model. The model was used to group 5871 mixed flue-cured tobacco leaves purchased from multiple places in Yunnan Province. The results showed that using the MobileViT's model, the grouping accuracy rates of positive group, deputy group and primary and secondary group reached 79.44%, 83.83% and 79.22% respectively, and increased 9.5%, 17.66% and 17.56% respectively compared with that of MobileNetV2; 13.8%, 30.83% and 34.12% increase in grouping accuracy rates of the three groups were observed using the MobileViT's model compared to the ViT model. Compared with the mobile NetV3, Efficient and Resenet50 models which are widely used currently, the packet accuracy of the mobile ViT model on the mixed group was increased by 11.86% compared with the lightweight mobile NetV3 network; Compared with the Effcient and Resnet50 models represented by CNN, the model size was increased by 9.6% and 6.55% respectively, and the model size was reduced by 24.62% and 79.1%. The lightweight MobileViT model could combine the advantages of the lightweight network MobileNetV2 and the ViT models, and has a high packet accuracy while reducing the size of the model, making it easier to be deployed in industrial equipments and meeting the actual industrial application requirements.
-
烟草是我国的重要经济农作物之一,烟叶分级准确性对后续的销售、使用和卷烟品质有直接影响,提高烟叶分级准确性具有重要意义[1]。烤烟分级流程是先分组再分级,烤烟分组效果影响着分级的准确性。现阶段,烟叶分组主要由技术人员依靠视觉对部位和颜色进行正副组初分,再结合成熟度、杂色、青色等其他因素完成分组[2]。由于烟叶收购过程中分组高度依赖于人的主观判断,分组的准确性受影响较大;且随着工作时间的持续增加,效率也会逐渐降低,产生较高的时间成本和人力成本[3]。因而亟需研究一种自动、快速、客观的烟叶分组方法,有效解决由主观因素导致的分级标准不一致,效率低等问题[4]。
随着计算机技术的不断发展,运用机器视觉技术进行烟叶颜色和部位的提取与机器学习相结合,实现烟叶分组与识别的研究越来越多[5]。大多数以烟叶颜色、形状、纹理特征与机器学习相结合的方法实现烟叶识别和分组[6]。Li等[7]采用遗传算法对烟叶光谱特征进行筛选,并通过SVM作为烟叶等级分类器,分类精度达到89.25%;徐淼[8]在Mask R-CNN区域建议网络中引入K-means聚类算法,实现对多片烟叶的同步识别;詹攀等[9]提出通过支持向量机提取烟叶的参数进行训练建立烟叶含水量预测模型;赖燕华等[10]采集烟叶的近红外光谱,利用随机森林算法建立了不同霉变烟叶的识别模型。以上算法一定程度上实现了对烟叶的分组与识别,但存在模型参数量大,运行速度慢的缺点,不能满足烟叶分级的实时性。
随着图像处理技术的发展,计算机深度学习以其更快的运行速度和精确度被广泛运用于目标识别与分类中,常见模型有MobileNetV2、Transformer、ViT(Vision Transformer)等[11]。黄乾峰等[12]为了识别番茄叶片病害种类,提高番茄种植产量,提出一种改进MobileNetV2网络的病害识别方法,在不影响识别精度的前提下减少模型的参数量并增强模型的鲁棒性,分类的准确率达到了98.57%,并且模型的大小减小了22.52%。扶兰兰等[13]提出基于Swin Transformer(Swin-T)模型的玉米生长期分类算法实现对玉米生长周期的识别,经过改进之后的模型在精度上比AlexNet、VGG16、DenseNet模型分别提升6.9%、2.7%、2.0%。Dosovitskiy等[14]提出Vision Transformer(ViT)模型,该模型不依赖卷积神经网络的结构,使用图像块(patch)作为分类网络的输入,从而取得了不错的分类效果。杜显君[15]提出了基于ViT的车辆分类模型,实现高速公路车辆分类,但由于ViT模型需要庞大的数据集进行训练,训练集不足的情况下无法得到好的识别效果,因此该模型具有一定的局限性。
以上深度学习方法虽然在针对不同场景时表现出优异的分类性能,但模型参数量较大,模型训练时间相对较长,不宜直接运用到烟叶分组的工业生产中。为解决深度学习算法运用于烟叶分组过程中,存在的深度学习模型训练过程时间过长,模型参数量大不便于后续部署等问题,提出了基于轻量化MobileViT网络的烤烟自动分组方法。首先采集烟叶图像进行预处理得到细节特征更加突出的烟叶图像;然后制作烟叶数据集,将其按照国标分为13个类别,其中正组为8个类别,副组为5个类别;然后通过轻量化MobileViT网络进行识别和分组,并与其他几种分类模型相比,MobileViT模型识别的准确率更高,可为后续烟叶分级模型提供帮助。
1. 烟叶图像采集与预处理
1.1 烟叶材料与图像采集
本文的研究对象为云南省烟叶质量监督检测站提供的云南省各州市2022年的实际收购烤烟烟叶。由多名烟叶分级专家按照GB 2653—1992《烤烟》的规定进行分级。分级后的烟叶使用工业摄像头进行图像采集,摄像头型号为M0824-MPW2,光源为XC-BK-650-1100,镜头与烟叶采集区域之间的垂直距离为90 cm。由输送带将烟叶送到镜头的采集范围内,完成烟叶图像的采集,采集设备如图1所示。
1.2 数据预处理与数据集的建立
在对深度学习模型进行试验之前,需对图像进行预分离处理,其处理步骤如图2所示。
(1)背景处理:利用Python对需要获取的数据集进行泛洪填充,并将每幅图片的背景设置为黑色,消除背景图像中输送带部分造成的干扰。
(2)前景提取:由于烟叶实体图像在采集后图像中占比较小,在自动识别烟叶颜色时,会导致烟叶的有效细节信息提取不足,信息不完整。因此,在背景处理完成后,对烟叶图像实施最小外接矩形的构造,再进行裁剪和仿射变换,完成图像的预分离,从而最大限度提取烟叶细节信息。
(3)数据集的标定与划分:依据分级专家意见,将通过前景和背景处理之后的烟叶数据集进行标定,分成正组和副组总共13个类别。
对所采集的烟叶图像,按照国标号将其分为正组和副组总共13个类别:其中正组分为XL(下部柠檬黄色组)、BL(上部柠檬黄色组)、CL(中部柠檬黄色组),XF(下部橘黄色组)、CF(中部橘黄色组)、BF(上部橘黄色组)、BR(上部红棕色组)、H(完熟叶组);副组分为CXK(中下部杂色烟叶组)、BK(上部杂色烟叶组)、S(光滑叶组)、GY(青黄烟叶组)、V(微带青叶组)。
构建数据集的烟叶由云南省烟草质量监督检测站提供。包含2022年云南省昆明、玉溪、曲靖、红河、楚雄、大理、昭通、保山、文山、普洱、丽江、临沧共12个烟叶产区的所有实际收购等级烟叶,从以上地区所有等级烟叶中随机抽取混合而成,训练集、验证集、测试集烟叶互为不包含关系。训练集的烟叶标定,以及验证集、测试集的结果确认工作均由云南省2022年烤烟工商交接检查组的专家按实际检查尺度负责完成。各类烟叶数据集情况如表1所示。
表 1 烟叶种类表Table 1. Types of tobacco leaves组别
Group等级
Grade训练集
Training set验证集
Validation set测试集
Test set总量
Total正组 XL 81 10 11 521 XF 380 47 48 475 CL 420 53 53 526 CF 375 47 47 469 BL 361 45 46 452 BF 441 55 56 552 BR 125 16 16 102 H 89 11 12 112 副组 CXK 458 57 58 573 BK 501 63 63 627 S 429 54 54 537 GY 520 65 66 651 V 219 27 28 274 2. 算法原理
2.1 Mobile-ViT模型
Mobile-ViT是一种轻量化的模型,其主要是由卷积层、MV2、MobileViT block、全局池化层和全连接层共同构成[16]。MobileViT网络结构如表2所示。input表示网络中每个模块输入的尺寸;operator表示每个特征层所遍历的模块;#out表示经过每个特征层后输出的通道数;L表示的是MVIT模块中Transformer模块的个数;s表示每一次操作的步长;MVIT表示MobileViT模块;MV2表示MobileNetV2模块中的Inverted Residual Block模块[17]。
表 2 MobileViT网络结构Table 2. MobileViT network structureInput Operator #out L s 2562×16 Conv2d 16 — 2 1282×16 MV2 32 — 1 1282×32 MV2 64 — 2 642×64 MV2 64 — 1 642×64 MV2 64 — 1 642×64 MV2 96 — 2 322×96 MVIT 96 2 1 322×96 MV2 128 — 2 162×128 MVIT 128 4 1 162×128 MV2 160 — 2 82×160 MVIT 160 3 1 82×160 Conv2d 640 — 1 82×160 avgpool 8×8 — — — 12×160 FC — — — 12×K Conv2d K — — MobileViT的目的在于解决ViT网络的缺陷,并将CNN的优点与Transformer的结构相结合,解决Transformer的训练、迁移、调整等困难问题,提高网络的推理能力和收敛速度,从而提高网络的稳定性和效率。ViT网络在进行模型训练时主要是将输入图像进行切分,形成多个16×16×3的Patch,然后通过Embedding层进行编码,但是会在切分的过程中造成像素点的缺失,从而导致特征信息的丢失。MobileViT为了加快模型的收敛和推理速度,采用深度可分离卷积操作对输入的图像进行初步特征提取和降维,能够在有效降低参数量的同时保留更多的细节特征[18]。
2.2 Inverted Residual Block(MV2)模块
MV2就是MobileNetV2里面的Inverted Residual Block,反向残差块由原来的先做深度卷积、后做点卷积转变为先做点卷积、后做深度卷积、最后再做一次点卷积运算方式。该方法可以在不增加计算量的情况下,增加网络的深度和非线性的表征能力,能够更好识别烟叶图像中比较复杂的图像特征。另外,当反向残差块的深度卷积步长为1时,输入与输出具有同一维数,其输出是最后一次点卷积的结果与输入的总和[19]。反向残差块的结构如图3所示。
2.3 MobileViT block模块
MobileViT block的作用是用更少的参数对全局和局部的信息进行建模。从图4的模型中可以看出,首先进行局部表征将烟叶特征图通过一个卷积层,其卷积核大小为n×n(此处n=3),再使用一个卷积核大小为1×1的卷积层来进行通道调整,然后进行全局表征依次使用Unfold、Transformer、Fold结构来进行全局特征建模。之后,再使用一个卷积核大小为1×1的卷积层将通道调整为原始大小,通过shortcut捷径分支与原始输入特征图按通道concat拼接。最后,再使用一个卷积核大小为n×n的卷积层进行特征融合,得到最终的输出[20]。
一般的ViT模型,是将输入H×W×C的特征图压缩为N×PC的特征图,再将其进行序列变换到d维空间得到N×d的特征图,对该特征图进行位置编码,然后输入Transformer,Transformer输出的特征图经过线性变化,得到最终结果,如图5示。
常规ViT模型的N×d的特征图失去了像素点的空间次序,而MobileViT通过添加1维来获得P×N×d的特征图,可以在每一个patch中保留各像素点的位置。采用普通卷积的神经网络局域连接这一重要特性,用感受野来描述神经元所看到的输入区域的大小。而MobileViT模型中,在Transformer之后,输出的特征图中,每一个像素点都来自于输出特征图的所有像素点。如图6所示,原始特征图被划分为9个patch,特征图中心的红色区域像素点与9个patch中的蓝色区域像素点做self-attention操作,而每个patch中的蓝色区域像素点都经过卷积得到其周围白色区域像素点的局部分析。此时一个蓝色区域像素点包含了一个patch中输入特征图的所有信息,最后在使用Transformer输出的特征图的所有像素点时,其局部的每个像素点都包含有特征图的全局信息[21]。
3. 自动分组结果及效果评价
3.1 试验环境
本文采用的数据集烟叶图像总数为5871张,其中正组烟叶3209张,副组烟叶2662张,正副混合组烟叶5871张。
试验环境如下:本试验主机中央处理器为i5-12490fCPU@3.6 GHz*12,运行内存为32 Gb,图形处理器为GeForceRTX3060 12 Gb,操作系统为Ubuntu22.04.1LTS。使用Anaconda3配置深度学习虚拟环境,python版本为3.8,Cuda版本为11.3,torch版本为1.12.0。在训练过程中使用SGD优化器,初始学习率设置为0.007,学习率下降方式为余弦退火,权值下降因子为0.000 1,动量因子为0.9。
3.2 效果评价指标
为了评估模型对烟叶分组的效果,本文采用模型大小(Size)、参数量(Param)、识别精确度(P)和计算量Flops为模型的评价指标。识别精确度(P)[22]和计算量(Flops)[23]用来衡量模型的复杂度,如公式(1)所示:
$$ {\mathrm{P}}= TP/(TP+FP) $$ (1) 式中:TP表示检测结果为正的正样本,FP表示检测结果为正的负样本,TP+FP表示检测结果为正的样本总数。
$$ {\mathrm{FLOP}}{{s = 2HW(}}{{{C}}_{{{{\mathrm{in}}}}}}{{\mathrm{K}}^2} + 1){{{C}}_{{\mathrm{out}}}} + (2{\mathrm{I}} - 1){\mathrm{O}} $$ (2) 式中:H、W、C为特征图长、宽和张量;I、O分别为全连接层输入、输出特征图张量;Cin、Cout分别为输入特征图维度和输出特征图维度。
3.3 结果分析
为了验证MobileViT模型的有效性,将其与MobileNetV2、ViT模型进行对比。首先,使用烤烟图像数据集对MobileViT模型进行训练,然后进行分组测试。由于MobileViT模型是针对MobileNetV2、ViT模型的缺点而进行改进的,继承了MobileNetV2的轻量级和高效性能,同时还利用了ViT的自注意力机制来提高模型对图像语义信息的理解能力。因此使得MobileViT模型的特征表达能力更好。
如图7所示将MobileNetV2、ViT模型与MobileViT进行横向对比分析,从损失函数和准确率图可以得出MobileViT收敛速度更快,损失函数相对于其他卷积神经网络模型在训练时较早就达到拟合状态,在准确率方面MobileViT对正组、副组和正副混合组的分组准确率更高,较于MobileNetV2、ViT两种准确率有大幅度提升。
由表3可知,在正组、副组和正副混合组的测试上,MobileViT的分组精准度明显要优于其他两种模型。MobileViT模型在准确率、精准度、召回率上均是最高,在正组的识别准确率比卷积神经网络的ViT模型高出13.8%,比轻量化网络MobileNetV2模型高出9.5%;副组的识别准确率比ViT模型高出30.83%,比MobileNetV2模型高出17.66%。表明MobileViT模型在烟叶的识别分组上表现出更好的性能。而针对于正副组烟叶的识别精准度,在单个的正副组的识别上MobileViT精确度分别达到了83.51%、83.35%,而在正副混合组的烟叶识别上精准度达到了81.13%,较比于其他两种模型有着明显的提升。在模型的参数上,MobileViT模型相比于卷积神经网络的Vit模型,在计算量Flops、参数量Params、模型大小Size上有着大幅度的降低,模型更加轻量化,并且在准确率、精度上有着大幅度的提升。MobileViT模型由于是基于ViT模型加入了MobileNetV2里的Inverted Residual Block模块,因此在计算量Flops、参数量Params、模型大小上较比于MobileNetV2模型都有所上升,但模型的精度、准确率都有着很大的提升。
表 3 3种不同模型分组结果对比Table 3. Comparison of grouping results of three different models模型
Model准确率Accuracy/% 精准度Precision/% 召回率Recall/% Flops/Gb Params/Mb Size/Mb 正组 副组 混合组 正组 副组 混合组 正组 副组 混合组 MobileViT 79.44 83.83 79.22 83.51 83.35 81.13 83.05 82.55 79.91 1.441 4.946 39.8 ViT 65.64 53.00 45.10 69.40 60.01 45.61 66.29 48.68 41.78 16.867 88.20 1126.4 Mobilenetv2 69.94 66.17 61.66 74.29 65.31 64.60 71.55 64.72 60.77 0.313 2.241 18.2 为了进一步验证MobileViT模型对烟叶分组的有效性,在正副混合组数据集上采用深度卷积神经网络Resnet50模型,基于强化学习的高效卷积神经网络Efficientnet模型,轻量化网络MobileNetV3模型与MobileViT模型进行对比。如图8所示,MobileViT模型在迭代40次之后开始收敛,其识别准确率已经趋于稳定并且准确率达到了79.22%。而Resnet50模型、Efficientnet模型、MobileNetV3模型在迭代50次之后才开始收敛,识别准确率才开始趋于稳定。而且,MobileViT模型在识别分组准确率上比MobileNetV3提高了11.86%,比Efficientne模型提高了9.6%,比Resnet50模型提高了6.55%。通过综合对比发现MobileViT模型对烟叶识别分组上有着更加突出的表现,更适合用于烟叶分组。
由表4不同模型对比可知,MobileViT模型仅在计算量上比基于强化学习的高效卷积神经网络Efficientnet模型略有增加,但参数量和模型大小都有明显降低。对比深度卷积神经网络Resnet50模型,计算量仅为35%,参数量和模型大小都有大幅降低。相对以上两种模型,除了多种参数更优外,MobileViT模型的准确率也更高。对比轻量化网络模型MobiletV3,计算量有所增加,模型参数和大小仅略有增加,但是在分组准确率上有压倒性优势。并且为了验证MobileViT模型在单个组别的测试效果,通过图9可以得出在不同组别的测试中其效果有着一定的差别。中部柠檬黄的准确率最高,在下部橘黄组的分类上由于烟叶叶片面积过大,在识别过程中烟叶表面杂色影响了分组的准确率。同样的在对上部红棕色组进行分组时,由于上部烟叶出现皱缩,在提取烟叶特征时,不能充分提取到更多有用信息,导致在分组时出现准确率不理想的情况。但从柱状图可以得出本次试验效果相对稳定,分组准确率在80%左右浮动,该模型具有较强的鲁棒性。
表 4 不同模型对比Table 4. Comparison of different models模型
Model计算性能
Flops/Gb模型参数量
Params/Mb模型大小
Size/Mb准确率/% MobiletV3 0.224 4.219 35.9 67.36 Efficienet 0.591 6.53 52.8 69.62 Resnet50 4.109 23.535 190.4 72.67 MobileViT 1.441 4.946 39.8 79.22 4. 结 论
为解决烟叶特征提取复杂与烟叶自动分组准确率低、模型大、难部署等问题,本文提出了一种基于轻量化MobileViT网络的烤烟自动分组方法。本模型结合MobileNetV2和ViT的优势,继承了MobileNetV2的轻量级和高效性能,同时还利用了ViT的自注意力机制来提高模型对图像语义信息的理解能力。将本文提出的模型与轻量化网络MobiletV2、MobiletV3对比,模型在分组准确率上有着明显的提升,而对比于基于CNN的Efficientnet、ViT、Resnet50模型,MobileViT模型在保证分组准确率的同时而且还大幅度降低了模型的参数量,减小了模型的大小,使模型更轻量化。通过试验证明本研究模型除了具有高准确率的优点外,可对烟叶自动分组,避免了人工分组所带来的主观性。但本模型在对灼伤烟叶和部分地区挂灰烟叶的识别上存在一定局限性,后续将研究使用更加精细的数据集,针对模型进行改进使其在混合组的分类上精度更高。
-
表 1 烟叶种类表
Table 1 Types of tobacco leaves
组别
Group等级
Grade训练集
Training set验证集
Validation set测试集
Test set总量
Total正组 XL 81 10 11 521 XF 380 47 48 475 CL 420 53 53 526 CF 375 47 47 469 BL 361 45 46 452 BF 441 55 56 552 BR 125 16 16 102 H 89 11 12 112 副组 CXK 458 57 58 573 BK 501 63 63 627 S 429 54 54 537 GY 520 65 66 651 V 219 27 28 274 表 2 MobileViT网络结构
Table 2 MobileViT network structure
Input Operator #out L s 2562×16 Conv2d 16 — 2 1282×16 MV2 32 — 1 1282×32 MV2 64 — 2 642×64 MV2 64 — 1 642×64 MV2 64 — 1 642×64 MV2 96 — 2 322×96 MVIT 96 2 1 322×96 MV2 128 — 2 162×128 MVIT 128 4 1 162×128 MV2 160 — 2 82×160 MVIT 160 3 1 82×160 Conv2d 640 — 1 82×160 avgpool 8×8 — — — 12×160 FC — — — 12×K Conv2d K — — 表 3 3种不同模型分组结果对比
Table 3 Comparison of grouping results of three different models
模型
Model准确率Accuracy/% 精准度Precision/% 召回率Recall/% Flops/Gb Params/Mb Size/Mb 正组 副组 混合组 正组 副组 混合组 正组 副组 混合组 MobileViT 79.44 83.83 79.22 83.51 83.35 81.13 83.05 82.55 79.91 1.441 4.946 39.8 ViT 65.64 53.00 45.10 69.40 60.01 45.61 66.29 48.68 41.78 16.867 88.20 1126.4 Mobilenetv2 69.94 66.17 61.66 74.29 65.31 64.60 71.55 64.72 60.77 0.313 2.241 18.2 表 4 不同模型对比
Table 4 Comparison of different models
模型
Model计算性能
Flops/Gb模型参数量
Params/Mb模型大小
Size/Mb准确率/% MobiletV3 0.224 4.219 35.9 67.36 Efficienet 0.591 6.53 52.8 69.62 Resnet50 4.109 23.535 190.4 72.67 MobileViT 1.441 4.946 39.8 79.22 -
[1] 李士静, 潘羲, 陈熙卓, 等 . 基于高光谱信息的烟叶分级方法比较[J]. 烟草科技,2021 ,54 (10 ):82 -91 .LI S J, PAN X, CHEN X Z, et al . Comparison of tobacco grading methods based on hyperspectral information[J]. Tobacco Science & Technology,2021 ,54 (10 ):82 -91 .[2] 鲁梦瑶, 陈栋, 周强, 等 . 基于深度学习的烟叶等级分类及特征可视化[J]. 烟草科技,2023 ,56 (6 ):92 -100 .LU M Y, CHEN D, ZHOU Q et al . Tobacco leaf grading and feature visualization based on deep learning[J]. Tobacco Science & Technology,2023 ,56 (6 ):92 -100 .[3] ZHANG K, SUN H, YANG Q, et al . Correlation analysis of leaf tobacco grade quality and its influencing factors in Yunnan[J]. Acta Tabacaria Sinica,2013 ,19 (5 ):98 -100 .[4] 江浩, 罗瑞林, 金雪松, 等 . 基于稠密连接卷积神经网络与混合注意力的烟叶图像分级方法[J]. 软件导刊,2023 ,22 (5 ):184 -189 .JIANG H, LUO R L, JIN X S, et al . Tobacco image grading method based on densely connected convolutional networks and hybrid attention[J]. Software Guide,2023 ,22 (5 ):184 -189 .[5] 马龙, 蒋仕飞, 王兵, 等 . 烟叶智能分级系统的设计与试验[J]. 现代农业科技,2023 (10 ):140 -145, 159 .MA L, JIANG S F, WANG B . Design and experiment of intelligent tobacco grading system[J]. Modern Agricultural Science and Technology,2023 (10 ):140 -145, 159 .[6] 冯建英, 苏允汇, 龚劭齐, 等 . 基于集成学习的农业生产技术效率评价方法[J]. 农业机械学报,2021 ,52 (S1 ):148 -155 .FENG J Y, SU Y H, GONG S Q, et al . Evaluation method of agricultural production technical efficiency based on ensemble learning[J]. Transactions of the Chinese Society for Agricultural Machinery,2021 ,52 (S1 ):148 -155 .[7] LI H, SHEN J Y, KONG Y L, et al. Screening the effective spectrum features of tobacco leaf based on GA and SVM[C]//Proceedings of the International Conference on Sensor Network and Computer Engineering, Xi'an, China. Paris: Atlantis Press, 2016: 201-204.
[8] 徐淼, 朱波, 刘宇晨, 等 . 基于改进Mask R-CNN的多片烟叶部位的同步识别[J]. 湖南农业大学学报(自然科学版),2023 ,49 (2 ):170 -175 .XU M, ZHU B, LIU Y C, et al . Synchronous recognition method of multiple tobacco leaves position based on improved Mask R-CNN[J]. Journal of Hunan Agricultural University (Natural Sciences),2023 ,49 (2 ):170 -175 .[9] 詹攀, 谢守勇, 刘军, 等 . 基于支持向量机回归的鲜烟叶含水量预测模型[J]. 西南大学学报(自然科学版),2016 ,38 (4 ):165 -170 .ZHAN P, XIE S Y, LIU J, et al . A prediction nodel of water content of fresh tobacoo leaves based on support vector machine regression[J]. Journal of Southwest University (Natural Science),2016 ,38 (4 ):165 -170 .[10] 赖燕华, 林云, 陶红, 等 . 烟叶霉变的快速识别——基于近红外光谱与随机森林算法[J]. 中国烟草学报,2020 ,26 (2 ):36 -43 .LAI Y H, LIN Y, TAO H, et al . Rapid identification of tobacco mildew based on near infrared spectroscopy and random forest algorithm[J]. Acta Tabacaria Sinica,2020 ,26 (2 ):36 -43 .[11] 袁奎. 烟叶特征的视觉信息表达与分级算法研究[D]. 贵州: 贵州大学, 2015. YUAN K. Research on visual information expression and classification algorithm of tobacco leaf characteristics[D]. Guihzou: Guizhou University, 2015
[12] 黄乾峰, 董琴, 韦静 . 改进MobileNetV2算法的番茄叶片病害种类识别[J]. 计算机系统应用,2023 ,32 (1 ):385 -91 .HANG Q F, DONG Q, WEI J . Identification of tomato leaf disease varieties by improved MobileNetV2 algorithm[J]. Computer Systems & Applications,2023 ,32 (1 ):385 -91 .[13] 扶兰兰, 黄昊, 王恒, 等 . 基于Swin Transformer模型的玉米生长期分类[J]. 农业工程学报,2022 ,38 (14 ):191 -200 .Fu L L, HUANG H, WANG H, et al . Classification of maize growth stages using the Swin Transformer model[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE),2022 ,38 (14 ):191 -200 .[14] DOSOVITSKIY A, BEYER L, KOLESNIKOV A, et al. An image is worth 16x16 words: transformers for image recognition at scale[C]. International Conference on Learning Representations, 2021.
[15] 杜显君 . 基于ViT的高速公路车辆细分类研究[J]. 现代计算机,2022 ,28 (12 ):51 -55 . doi: 10.3969/j.issn.1007-1423.2022.12.009DU X J . Research on freeway vehicle fine-grained classification based on ViT[J]. Modern Computer,2022 ,28 (12 ):51 -55 . doi: 10.3969/j.issn.1007-1423.2022.12.009[16] 熊李艳, 涂所成, 黄晓辉, 等 . 基于MobileVit轻量化网络的车辆检测方法[J]. 计算机应用研究,2022 ,39 (8 ):2545 -2549 .XIONG L Y, TU S C, HUANG X H, et al . Vehicle detection method based on MobileVit lightweight network[J]. Application Research of Computers,2022 ,39 (8 ):2545 -2549 .[17] SANDLER M, HOWARD A, ZHU M L, et al. MobileNetV2: inverted residuals and linear bottlenecks[C]//Proceedings of the Conference on Computer Vision and Pattern Recognition, Salt Lake City: IEEE, 2018: 4510-4520.
[18] 王琼, 杨杰, 霍凤财, 等.基于MobileViT的岩石薄片图像岩性识别方法研究[J/OL]. 地质通报: 1-11[2023-08-15]. http://kns.cnki.net/kcms/detail/11.4648.P.20230227.1811.002.html. WANG Q, YANG J, HUO F C, et al. Research on lithology identification method of rock thin section images based on MobileViT [J/OL]. Geological Bulletin of China: 1-11[2023-08-15]. http://kns.cnki.net/kcms/detail/11.4648.P.20230227.1811.002.html.
[19] ZOU Y Y, ZHAO L N, QIN S X, et al. Ship target detection and identification based on SSD_MobilenetV2[C]//2020 IEEE 5th Information Technology and Mechatronics Engineering Conference (ITOEC), Salt Lake City: IEEE, 2020: 1676-1680.
[20] 郑玉珩, 黄德启. 改进MobileViT与YOLOv4的轻量化车辆检测网络[J]. 电子测量技术, 2023, 46(2): 175-183. ZHENG Y H, HUANG D Q. Light weight vehicle detection network based on MobileViT and YOLOv4[J]. Electronic MeasurementTechnology, 2023, 46(2): 175-183.
[21] MEHTA S, RASTEGARI M. MobileViT: Light-weight, general-purpose, and mobile-friendly vision transformer. arXiv: 2110.02178[[Preprint]. 2021-10-05[2023-08-15]. https://doi.org/10.48550/arXiv.2110.02178.
[22] GULZAR Y . Fruit image classification model based on mobilenetv2 with deep transfer learning technique[J]. Sustainability,2023 ,15 (3 ):1906 .[23] MA R, WANG J, ZHAO W, et al . Identification of maize seed varieties using mobilenetv2 with improved attention mechanism CBAM[J]. Agriculture-Basel,2023 ,13 (1 ):11 . -
期刊类型引用(1)
1. 黄本荣,范兆烽,王飞,江逸昕,马祥根,肖光林,詹德良,吴善建,黄嘉星,温永仙. 基于VGG16-DenseNet集成模型的烤烟智能分级. 中国烟草科学. 2024(03): 102-112 . 本站查看
其他类型引用(1)