返回

团队研究成果被人工智能领域知名国际会议IJCAI2026主会接收

近日,由团队博士生杨丽、黄雁勇教授、常晋源教授、智翎科技CTO郑欧、清华大学博士后马敏博以及明斯特大学蒋晓毅教授合作完成的论文”EMMS: Multi-Label Multi-Dimensional Selection”被人工智能领域知名国际会议IJCAI 2026主会接收。

内容简介

多标签数据广泛存在于图像识别、文本分类、生物信息学等领域。与传统单标签数据不同,一个样本往往同时对应多个标签,例如一张旅游照片可以同时被标注为“海滩”“日落”“人物”等多个标签。然而,真实场景中的多标签数据往往伴随着高维特征、异常样本以及标签噪声等问题,容易引发维度灾难,并干扰模型对有效样本与可靠标签信息的学习,进而影响后续分类和预测等任务的性能。针对上述问题,传统方法往往仅独立地选择有代表性的特征、样本或标签,而忽视了三者在选择过程中的相互影响;同时,这些方法通常假设标签标注不存在噪声,但这一假设在实际应用中往往难以成立。基于此,本文提出一种基于证据理论的多标签多维选择方法,实现特征、样本与标签的联合选择。该方法通过构建带稀疏约束的双重投影机制,将高维数据依次映射到潜在空间和标签空间,并结合投影残差的显式建模识别代表性样本,从而实现三者的统一选择;进一步引入证据理论融合样本层面与标签层面的证据信息,以提高标签学习可靠性并减弱噪声标签的干扰。大量实验结果表明,该方法在多项评价指标上均优于现有主流方法,且在多标签图像数据集上的案例分析进一步验证了该方法的有效性。

作者简介

杨丽,西南财经大学2024级经济大数据专业博士生,导师为黄雁勇教授,主要从事数据挖掘和模式识别等领域的研究。

黄雁勇, 西南财经大学数据科学与商业智能联合实验室教授、博士生导师,主要从事Data-centric AI、多模态学习、增量学习等领域的研究。

常晋源,西南财经大学光华首席教授、数据科学与商业智能联合实验室执行主任、统计交叉创新研究院执行院长,主要从事复杂数据分析相关的研究。

郑欧,智翎科技CTO,主要从事计算机视觉、数字孪生、AI 多模态大模型与交叉学科等领域的应用研究。

马敏博,清华大学博士后,主要从事人工智能与时空数据挖掘技术在可再生能源、城市计算等领域的交叉应用研究。

蒋晓毅,德国明斯特大学数学与计算机科学系教授、博士生导师,国际模式识别学会(IAPR)会士,亚洲人工智能协会(AAIA)会士,国际期刊International Journal of Pattern Recognition and Artificial Intelligence主编,德国华人教授学会主席、国际生物医学成像研讨会主席,主要从事计算机视觉、模式识别、机器学习、生物医学图像分析等领域的研究。