北大计算机学院数据所6篇论文入选人工智能顶级会议AAAI 2025
近日,人工智能顶级会议AAAI2025放榜,据不完全统计,有6篇来自北京大学数据科学与工程所的高水平论文成功入选。一年一度的AAAI是人工智能领域最具影响力的学术会议之一,会议涵盖了人工智能领域的各个方面,包括理论、方法、应用和实践,吸引了来自全球学术界和工业界的顶尖研究人员和从业者参与,交流最新研究成果、讨论前沿技术并且探讨未来趋势。本次AAAI2025 共收到12,957篇投稿,其中3,032篇被接受,接受率为23.4%。AAAI 2025 会议将于2025年2月25日至3月4日在美国宾夕法尼亚州费城举行。
6篇AAAI2025论文中,研究成果涉及到图神经网络、多模态、推荐系统等人工智能的相关领域。以下是论文的简要介绍:
一、通过噪声遮掩实现可扩展的深度图神经网络
图神经网络在训练过程中重复的特征传播和非线性变换往往需要昂贵的计算和存储成本,将它们扩展到大型图具有挑战性。应对这一挑战的一种常用方法是模型简化,尽管这类方法具有很高的预测性能和可扩展性,但它们仍然面临两个限制。首先,它们主要侧重于从模型角度探索不同的组合方法,而忽略了传播加深的过度平滑问题。其次,预处理开销占用了大部分端到端处理时间。
为了解决这些限制,论文提出了带噪声遮掩的随机游走方法,这是一个与现有模型简化工作兼容的即插即用模块。该模块可以探索更深的 GNN,同时保留其可扩展性。与以前的模型简化工作不同,论文发现每个传播内部存在的噪声是导致过度平滑问题的原因,并使用有效的掩码机制来消除它们。在六个真实数据集上的实验结果表明,集成论文方法的模型简化工作比其原始版本具有更好的性能,并且可以在准确性和效率之间取得良好的平衡。
该论文第一作者为梁宇轩(北京大学),合作作者包括张文涛,盛泽昂,杨灵(北京大学),徐泉清(oceanbase),江佳伟教授(武汉大学),童云海教授(北京大学),崔斌教授(北京大学,通讯作者)。
二、TRACI:面向图数据的多域泛化数据驱动方法
图神经网络(GNNs)在图预测任务中取得了显著的进展,广泛应用于社交分析、药物发现等领域。然而,当面对具有分布漂移的测试图时,GNNs的性能仍然存在局限。现有的领域适应方法通常利用无标签的测试图进行优化,但难以应对“野外”图数据的挑战。为了解决这一问题,AAAI2025论文《TRACI: A Data-centric Approach for Multi-Domain Generalization on Graphs》提出了一种新方法TRACI,旨在实现多域泛化,提升GNN在未见目标图上的性能。TRACI的核心思想是从数据驱动的角度,生成虚拟对抗性和混合图样本,以增强GNN的泛化能力。具体来说,TRACI采用了一种基于梯度上升的策略,综合考虑标签预测的熵和图结构,生成挑战性的对抗样本。同时,为了生成领域无关的节点表示,TRACI通过潜在分布来表征类别-图对原型,并采用多样本原型Mixup技术生成虚拟图,从而实现多个图的分布对齐。此外,论文还提供了理论分析,证明该方法有效降低了模型的超额风险。通过在多个基准数据集上的大量实验,TRACI表现出了比现有方法更优越的性能,证明了其在多域泛化任务中的有效性。
该论文第一作者为数据科学与工程所硕转博研究生赵禹昇,指导老师为张铭教授。合作作者包括王长虎博士后(加州大学洛杉矶分校,北大校友),罗霄(加州大学洛杉矶分校,北大校友,通讯作者),罗钧宇(北京大学,博士导师为张铭),琚玮(四川大学,北大校友),肖之屏(华盛顿大学博士后,北大校友,通讯作者),张铭教授(通讯作者)。
三、ABPEM:基于注意力引导的多模态测试时适应方法
在多模态测试时适应(TTA)任务中,模型需要在没有训练数据的情况下,利用无标签的测试数据应对分布漂移。与单一模态的情况不同,多模态环境下的分布漂移更为复杂,亟需新的方法来处理。AAAI2025论文《Attention Bootstrapping for Multi-modal Test-time Adaptation》提出了一种名为ABPEM的新方法,旨在解决这一问题。ABPEM的核心思想是解决“注意力差距”问题,即模态内部的自注意力和模态间的交叉注意力之间的差异。作者发现,测试时分布漂移加剧会导致这一差距扩大,从而妨碍模态的有效融合。为此,ABPEM通过“注意力引导”策略,利用自注意力来促进交叉注意力的有效性,而无需增加额外的可训练参数。此外,ABPEM还引入了“主要熵最小化”方法,聚焦于熵的主要部分,减少不可靠部分带来的梯度噪声。实验结果表明,ABPEM在多个基准任务上表现优异,超越了现有的主流方法,证明了其在多模态测试时适应中的有效性。
该论文第一作者为数据科学与工程所硕转博研究生赵禹昇,指导老师为张铭教授。合作作者包括罗钧宇(北京大学,博士导师为张铭),罗霄(加州大学洛杉矶分校,北大校友,通讯作者),黄进晟(北京大学,博士导师为张铭教授),袁境阳(北京大学,博士导师为张铭),肖之屏(华盛顿大学博士后,北大校友,通讯作者),张铭教授(通讯作者)。
四、基于图状态空间模型的兴趣点推荐系统
兴趣点(POI)推荐在各种基于位置的社交网络应用中发挥着重要作用。以往的研究主要关注现有序列模型的改进,却忽略了POI访问序列通常涉及地理和意图信号的连续状态转换。此外,交互之间的时间跨度较大,要求模型能够有效识别用户的多层次偏好。受到状态空间模型SSM用于处理复杂时间信号的启发,我们提出了一种专为时空POI序列设计的状态模型。相比传统的SSM(如Mamba)受限于线性序列,我们提出的GeoMamba对模型状态进行了定制,以适配时空序列。
在本文中,我们改进了线性SSM中利用的HiPPO近似算子,并引入了一种新颖的GaPPO算子,将模型的状态空间扩展到基于图表示的地理域。这一创新使我们能够构建结合用户时空特征的地理SSM编码器。GeoMamba的序列感知输出进一步被优化以生成多尺度行为表示。大量实验结果表明,GeoMamba在多个最先进的基线模型上表现出卓越的优势。
该论文第一作者为数据科学与工程所博士生覃义方,指导老师为张铭教授。该论文第一作者为覃义方(北京大学),合作作者包括谢佳璇(北京大学地空学院本科生,已保研至北大软微学院),肖之屏(华盛顿大学博士后,北大校友,通讯作者),张铭教授(北京大学,通讯作者)。
五、DisCo: 基于细粒度意图识别的跨域推荐框架
冷启动用户推荐问题是推荐系统中一项长期存在的挑战。跨域推荐(CDR)通过利用源域的用户交互信息来提升目标域的推荐性能,为解决该问题提供了一种有前景的思路。然而,用户在不同领域可能表现出截然不同的兴趣偏好,直接迁移嵌入信息可能会引入无关甚至有害的协同信息,导致负迁移问题。
为了应对上述挑战,AAAI 2025 论文《DisCo: Graph-Based Disentangled Contrastive Learning for Cold-Start Cross-Domain Recommendation》提出了一种名为 DisCo 的新型基于图的去耦对比学习框架。该框架旨在通过捕获用户的细粒度意图表示,并过滤源域中不相关的信息,来有效解决冷启动跨域推荐中的负迁移问题。具体来说,DisCo 包括以下核心模块:首先,设计了一个多通道图编码器,从用户交互数据中提取多种细粒度的用户意图。然后,通过构建亲和图并进行多步随机游走,捕获用户在源域和目标域中的高阶相似性关系。此外,为了最大化领域迁移的有效性并避免负迁移,DisCo 提出了一种意图级别的对比学习框架,同时进行域内和跨域对比学习以保留用户相似性信息。最后,DisCo 在四个真实世界的跨域推荐数据集上进行了大量实验,与现有最先进的方法相比,显著提升了冷启动用户的推荐性能。
该论文第一作者李厚润是北京大学计算中心的硕士生,在张铭教授课题组实习,共同一作王一帆是对外经济贸易大学助理教授。合作作者还有肖之屏(华盛顿大学,北大校友,通讯作者),杨加(北京大学),周昌令(北京大学),琚玮(四川大学副研究员,北大校友,通讯作者),张铭教授(通讯作者)。
六、3GNN: 基于聚类对比学习的类别不平衡图分类框架
现有的图神经网络方法通常依赖于数据集中类别分布均衡的假设,然而这一假设在许多实际场景中并不成立。在现实场景中,大部分类别仅有少量有标签的图(被称为少数类),而少部分类别则拥有显著多的有标签图样本(被称为多数类),呈现出严重失衡的类别分布。在处理不平衡图结构数据时,图神经网络的建模能力仍显不足,这通常导致模型预测偏向于多数类。为解决这一问题,AAAI25论文《Cluster-guided Contrastive Class-imbalanced Graph Classification》提出了一种简单而有效的方法,将聚类的思想引入对比学习,从而提升类别不平衡图分类的性能。该方法通过将多数类中的图划分为多个子类,使其规模接近于少数类,从而缓解类别不平衡问题。同时,采用Mixup技术生成新样本,丰富每个子类的语义信息,并利用监督对比学习以层次化方式学习有效的图表示。通过这种设计,不仅能够充分挖掘多数类中的语义子结构,还能有效避免对少数类的过度关注。
该论文第一作者为四川大学副研究员琚玮,北大博士和博士后,合作导师为张铭教授。合作作者包括毛正阳(北京大学,硕士导师为张铭),易思宇(四川大学博士后,通讯作者),覃义方(北京大学,博士导师为张铭),顾怿洋(北京大学,博士导师为张铭),肖之屏(华盛顿大学博士后,北大校友),沈剑豪(华为海思,北大校友),乔子越(大湾区大学助理教授),张铭教授(通讯作者)。