51五湖四取四海之财

我院智能感知与信息处理团队在SCI二区Neurocomputing期刊上发表最新研究成果

51五湖四取四海之财/新闻通知2022-03-30 09:21:43来源:5123五湖之利取四海开评论:0点击:收藏本文

“智能感知与信息处理”研究团队梁军、许飞腾、余松森(通讯作者)在SCI期刊Neurocomputing(影响因子:5.719、中科院SCI二区、Top期刊、JCR:Q1)发表研究论文---《A Multi-scale Semantic Attention Representation for Multi-Label Image Recognition with Graph Networks》,并于2022年3月29日在线发表,发表网址为:https://authors.elsevier.com/a/1epyR3INukKfT6

image.png


该论文的主要工作为:

为了缓解在标签特征与全局图像特征的融合过程中,初始图像大小不同以及卷积过程中图像特征的规模大小不同所产生的信息丢失问题,该文在全局图像特征与标签信息进行融合时引入了多尺度策略;同时,为了挖掘图像局部区域与标签信息之间的关系,该文提出了一个基于语义引导的注意力模块来提升模型对图像关键区域的识别能力,以及一种点对点的注意力池化方法,将学习到的注意力权重与图像特征进行融合,达到加强图像重点区域特征、减弱图像无关区域特征在最终预测值计算过程中的比重的目的。该文的模型图如图1所示。 MS-COCO和 PASCAL VOC 2007 两个数据集上和同行对比实验结果表明,该模型具有良好的性能,也揭示了图像全局和局部特征的互补和融合对图像特征提取起到了积极的作用。

image.png



撰稿:许飞腾、梁军

审稿:余松森





标签: