细粒度图像分类上Vision Transformer的发展综述

文献类型: 中文期刊

第一作者: 孙露露

作者: 孙露露;刘建平;王健;邢嘉璐;张越;王晨阳

作者机构:

关键词: 细粒度图像分类;Vision Transformer;特征提取;特征关系构建;特征注意;特征增强

期刊名称: 计算机工程与应用

ISSN: 1002-8331

年卷期: 2024 年 010 期

页码: 30-46

收录情况: CSCD

摘要: 细粒度图像分类(fine-grained image classification,FGIC)一直是计算机视觉领域中的重要问题。与传统图像分类任务相比,FGIC的挑战在于类间对象极其相似,使任务难度进一步增加。随着深度学习的发展,Vision Transformer(ViT)模型在视觉领域掀起热潮,并被引入到FGIC任务中。介绍了FGIC任务所面临的挑战,分析了ViT模型及其特性。主要根据模型结构全面综述了基于ViT的FGIC算法,包括特征提取、特征关系构建、特征注意和特征增强四方面内容,对每种算法进行了总结,并分析了它们的优缺点。通过对不同ViT模型在相同公用数据集上进行模型性能比较,以验证它们在FGIC任务上的有效性。最后指出了目前研究的不足,并提出未来研究方向,以进一步探索ViT在FGIC中的潜力。

分类号: TP391.41

  • 相关文献

[1]基于特征增强的多方位农业问句语义匹配. 王奥,吴华瑞,朱华吉. 2023

[2]田间害虫图像识别中的特征提取与分类器设计研究. 张红涛,胡玉霞,赵明茜,邱道尹,张孝远,张恒源. 2008

[3]近红外光谱的苹果内部品质在线检测模型优化. 郭志明,黄文倩,陈全胜,彭彦昆,赵杰文. 2016

[4]基于视频的植物动画合成方法. 蒋艳娜,肖伯祥,郭新宇,杨宝祝. 2015

[5]基于线结构光视觉的穴盘苗外形参数在线测量系统研制及试验. 冯青春,刘新南,姜凯,范鹏飞,王秀. 2013

[6]基于分形维数的放牧地秃斑特征提取方法及其应用. 王钊齐,林慧龙. 2011

[7]基于扫描成像的作物近地高光谱获取与特征分析. 张东彦,黄文江,王纪华,杨贵军,朱大洲,刘镕源,马智宏. 2010

[8]支持向量机的动物血液光谱特征提取和识别分类. 卢鹏飞,范雅,周林华,钱军,刘林娜,赵思言,孔之丰,高斌. 2017

[9]基于机器视觉的作物多姿态害虫特征提取与分类方法. 李文勇,李明,陈梅香,钱建平,孙传恒,杜尚丰. 2014

[10]基于深度图像和BP神经网络的肉鸡体质量估测模型. 王琳,孙传恒,李文勇,吉增涛,张翔,王以忠,雷鹏,杨信廷. 2017

[11]基于深度学习的油菜籽粒图像分割方法初探. 彭顺正,黄筑斌,岳延滨,吴小波. 2020

[12]基于图像分割与融合特征的黄瓜叶片含水量分析方法. 何林飞,朱煜,钱婷婷,汪妍. 2019

[13]基于数字照片特征的小麦覆盖度自动提取研究. 李存军,王纪华,刘良云,王人潮. 2004

[14]利用太赫兹光谱技术构建番茄水分胁迫状态检测模型. 张晓东,段朝晖,毛罕平,高洪燕,石强,王亚飞,沈宝国,张馨. 2021

[15]基于图像处理技术的观赏菊品种识别方法研究. 翟果,李志敏,路文超,赵勇,王成. 2016

[16]家蚕微粒子病的图像识别技术研究. 张香琴,方如明,汪萍,蔡健荣,许俐. 2001

[17]基于SVM的水稻稻瘟病识别方法. 赵开才,石凤梅,孟庆林,马立功. 2013

[18]基于经验模态分解与极限学习机的粮食产量模型预测. 袁世一. 2024

[19]基于玉米冠层原位监测的全生育期叶色建模及其应用. 杜建军,袁杰,王传宇,郭新宇. 2017

[20]基于支持向量机的水稻纹枯病识别研究. 刘婷婷. 2011

作者其他论文 更多>>