CCAI 2020 | 耿新—经典论文工作推荐-

2020年中国人工智能大会（Chinese Congress on Artificial Intelligence 2020，简称“CCAI 2020”）将于8月29日-30日在南京召开。CCAI 2020以“智周万物”为主题，探讨人工智能作为引领未来的战略性技术，如何以周知万物的学术境界赋能未来，带动时代发展，实现互联世界的远大理想。

东南大学计算机学院、软件学院院长、人工智能学院执行院长，国家优青，IETI Distinguished Fellow耿新将出席本次大会并担任《青年科学家专题论坛》论坛主席。

耿新：分别于2001年和2004年在南京大学计算机科学与技术系获得学士和硕士学位，于2008年获得澳大利亚Deakin大学博士学位。创建东南大学模式学习与挖掘（PALM）实验室并担任实验室主任至今。目前主要从事机器学习、模式识别、计算机视觉等方面的研究。曾获国家级教学成果奖一等奖、教育部自然科学奖一等奖等多项教学、科研奖励，入选国际工程与技术学会（IETI）杰出会士。曾获国家优秀青年科学基金、江苏省杰出青年科学基金资助，主持国家重点研发计划课题、国家自然科学基金等多个科研项目。

Partial Multi-Label Learning with Label Distribution

论文地址：

http://palm.seu.edu.cn/xgeng/files/aaai20.pdf

介绍：部分多标签学习（PML）旨在从训练示例中学习，每个训练示例都与一组候选标签相关联，其中只有一个子集对训练示例有效。推导预测模型的常见策略是尝试消除候选标签集的歧义，例如通过利用每个候选标签的置信度来识别真值标签或估计候选标签集中的噪声标签。尽管如此，这些策略忽略了考虑与每个实例相对应的基本标签分布，因为标签分布在训练集中未明确可用。本文提出了一种新的部分多标签学习策略，称为PML-LD，以通过标签增强从部分多标签示例中学习。具体来说，通过利用特征空间的拓扑信息和标签之间的相关性来恢复标签分布。之后，通过使用恢复的标签分布拟合正则化的多输出回归变量来学习多类预测模型。在合成数据集和实际数据集上的实验结果清楚地证明了PML-LD解决PML问题的有效性。

Multi-Person Pose Estimation with Enhanced Channel-wise and Spatial Information

论文地址：

http://palm.seu.edu.cn/xgeng/files/cvpr19.pdf

介绍：多人姿势估计是计算机视觉中一个重要但具有挑战性的问题。尽管当前的方法通过融合多尺度特征图取得了显著进展，但它们很少关注增强特征图的通道和空间信息。在本文中，我们提出了两个新颖的模块来执行多人姿势估计信息的增强。首先，提出了信道混洗模块（CSM），对不同层次的特征图采用信道混洗操作，促进了金字塔特征图之间的跨信道信息通信。其次，设计了空间-通道注意力残余瓶颈（SCARB），以通过注意力机制增强原始残余单元，在空间和通道方式中自适应突出显示特征图的信息。我们提出的模块的有效性在COCO关键点基准上进行了评估，实验结果表明，我们的方法达到了最先进的效果。

Label Distribution Learning on Auxiliary Label Space Graphs for Facial Expression Recognition

论文地址：

http://palm.seu.edu.cn/xgeng/files/cvpr20.pdf

介绍：现有的许多研究表明，注释不一致在各种面部表情识别（FER）数据集中广泛存在。原因可能是人类注释者的主观性和表情标签的含糊性质。解决这一问题的一种有前途的策略是最近提出的称为标签分布学习（LDL）的学习范式，该范式允许将具有不同强度的多个标签链接到一个表情。但是，直接应用标签分布学习通常是不切实际的，因为许多现有数据集仅包含一个独热标签，而不包含标签分布。为了解决该问题，我们提出了一种名为“在辅助标签空间图上进行标签分布学习”（LDL-ALSG）的新颖方法，该方法利用了来自相关但更独特的任务（例如动作单元识别和面部标志检测）的标签拓扑信息。基本假设是面部图像在动作单元识别和面部标志检测的标签空间中应具有与其邻居相似的表情分布。我们提出的方法在各种数据集上得到了评估，并且始终以极大的优势胜过那些最先进的方法。

Practical Age Estimation Using Deep Label Distribution Learning

论文地址：

http://palm.seu.edu.cn/xgeng/files/FCS20.pdf

介绍：年龄估计在人机交互系统中起着重要作用。缺乏大量的具有确定年龄标签的面部图像使得年龄估计算法效率低下。事实证明，采用卷积神经网络（CNN）和标签分布学习来从真实年龄和邻近年龄学习歧义的深度分布学习（DLDL）优于当前的最新框架。但是，DLDL假定标签分布很粗糙，涵盖了任何给定年龄标签的所有年龄。在本文中提出了一种更实用的标签分配范式：我们限制年龄标签分配，使其仅涵盖合理数量的相邻年龄。此外，我们探索了不同的标签分布，以提高提出的学习模型的性能。我们采用CNN和改进的标签分配学习方法来估算年龄。实验结果表明，与DLDL相比，我们的方法对面部年龄识别更为有效。

Discrete Binary Coding based Label Distribution Learning

论文地址：

http://palm.seu.edu.cn/xgeng/files/ijcai19b.pdf

介绍：标签分发学习（LDL）是机器学习中的一种通用学习范式，其特殊情况包括单标签学习（SLL）和多标签学习（MLL）。最近，已经提出了许多LDL算法来处理不同的应用任务，例如面部年龄估计、头部姿势估计和视觉情绪分布预测。但是，大多数现有LDL算法的训练时间复杂度过高，这使其不适用于大规模LDL。在本文中，我们提出了一种新颖的LDL方法来解决此问题，称为基于离散二进制编码的标签分发学习（DBC-LDL）。具体来说，我们设计了一个有效的离散编码框架来学习实例的二进制代码。此外，成对语义相似性和原始标签分布都集成到此框架中，以学习具有高度区分性的二进制代码。另外，快速近似最近邻（ANN）搜索策略用于预测测试实例的标签分布。在五个真实数据集上的实验结果表明，它具有比几种最新的LDL方法优越的性能，且具有较低的时间成本。