祝贺实验室博士后颜鲲论文被期刊TOMM录用

近日,北京大学智能计算与感知实验实验室博士后颜鲲的“Modelling Multi-modal Cross-interaction for Multi-label Few-shot Image Classification Based on Local Feature Selection”论文被SCI一区期刊(JCR Q1,IF:5.2)ACM Transactions on Multimedia Computing, Communications, and Applications (TOMM)录用,论文指导老师为王平教授。

image.png

该论文在多标签小样本图像分类任务上提出了一种新的多模态视觉原型生成方法。首先使用词向量对原型向量进行初始化,从而可以将文本信息作为待分类类别的知识先验;其次基于初始原型向量提出一种基于损失测量的特征评测策略,可以从支持集图像中挑选出代表性局部特征;最后,依赖初始原型特征通过提出一种多模态交叉交互机制聚合这些代表性局部特征来构建类别的最终原型向量。

初次之外,论文中还基于NUS-WIDE和iMaterialist数据集构建了新的多标签小样本图像分类评测数据集,论文方法在COCO、PASCAL VOC、NUS-WIDE和iMaterialist四个公开数据集中都获得了最优性能。

TOMM期刊由ACM协会负责出版,被SCI收录,其JCR分区为Q1,影响因子为5.2,同时也是中国计算机学会(CCF)推荐的B类国际期刊。

image.png


CLOSE