最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • ACE-HGNN自适应曲率探索的双曲图神经网络

    本文主要介绍作者团队在ICDM’2021上发表的工作,ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network。

    论文: 代码:

    图神经网络(GNNs)在各种图数据挖掘任务中得到了广泛的研究,但现有的大部分工作都是基于欧几里得空间嵌入,很难自然地捕捉到图数据的非欧几里得结构。因此,近年来,一些基于非欧几何空间的工作在机器学习领域发展迅速。其中,双曲几何空间中的双曲图神经网络(HGNNs)将 GNN 扩展到双曲空间,用于节点表示学习。更有效地捕获图形的树/层次结构。然而,在现实中,对于拓扑结构复杂多样的图数据,HGNN对于拓扑结构异构的图数据往往表现不佳。

    为了自适应探索适合 HGNN 的双曲嵌入空间,我们首次将强化学习的学习框架引入 HGNN,并提出了一种用于 ACE-HGNN 自适应曲率探索的双曲图神经网络。最佳曲率的任务自适应学习。我们将图的曲率探索和表示学习视为一个同步的多目标优化问题,使用多智能体强化学习(MARL)设计了ACE-Agent和HGNN-Agent,分别用于学习曲率和节点表示,并通过Nash-Q 学习算法通过使代理达到纳什均衡来协作学习并解决问题。

    一、研究背景

    图通常用于对复杂关系进行建模。通过图表示学习可以有效地学习数据的顺序、拓扑和几何等关系特征。众所周知,图是非欧式结构的,因此非欧式几何嵌入在机器学习领域受到了关注,并被引入以提高学习图的拓扑结果的能力。此外,复杂网络领域的研究表明,真实网络数据中存在大量的无标度特性,这意味着现实中普遍存在树状/层次结构。其中,双曲几何被视为传统网络科学领域中树/层次结构的底层连续表示,近期涌现出一大批优秀作品。在双曲几何中,双曲空间的曲率是几何空间曲率的度量,不同的曲率可以控制双曲几何流形来逼近图的不同程度的树状/层次结构(如下图)。

    树状结构

    然而,现有的 HGNNs 方法对于现实世界的复杂图数据和多样化的下游任务往往表现不佳,主要是由于以下两个缺陷:

    适应性问题:就数据而言,现实的图数据通常具有异构的拓扑结构(即同时存在树形、环形或网格结构);在任务方面,不同的下游任务对特征信息和拓扑信息的要求不同。诸如层次结构之类的特殊拓扑对任务的重要性是未知的。

    · 最优曲率问题:现有工作主要有两种曲率选择方法。使用曲率作为超参数,启发式地使用经验或使用采样估计算法进行估计;在训练过程中直接使用曲率作为神经网络参数来学习。前一种方法仅依靠原始图的拓扑来估计曲率基于q学习算法和bp神经网络的倒立摆控制,不能适应不同的下游任务;后一种方法严重依赖节点表示的梯度下降方向,模型只对曲率进行微调以保证节点表示的快速收敛,难以实现。找到最佳曲率。

    所以一个自然的问题是,“我们能否根据不同图的树/层次结构和下游任务驱动程序自适应地找到曲率最优的双曲几何空间,并使用双曲图神经网络来学习更好的节点符号?”

    为了解决上述问题,我们提出了一种新的自适应曲率探索双曲图神经网络,名为 ACE-HGNN。主要贡献如下:

    · 观察分析不同层次结构的HGNN在双曲空间中的自适应问题,将嵌入空间自适应问题转化为双曲空间中的最优曲率探索问题。

    我们首次在双曲几何机器学习中引入强化学习。提出了一种新颖的端到端架构,即自适应曲率探索双曲图神经网络(ACE-HGNN)来指导最佳双曲几何空间的选择。

    在五个典型的现实世界数据集上进行的广泛实验显示了显着和改进的模型适应和竞争性能。我们将 ACE-HGNN 的结果可视化,直观地展示了我们的方法捕获图结构的能力。

    二、双曲几何中的曲率和图形层次

    双曲几何嵌入在复杂网络领域得到了广泛的研究和应用。双曲几何空间(流形)可以直接理解为连续的近似树,其中曲率衡量的是弯曲流形(双曲空间)的曲率。弯曲度。现有工作表明,具有不同结构(例如,环或树结构)的图在嵌入欧几里得或双曲几何空间时具有不同的信息失真。下图(图1))说明了双曲曲率和图层次结构之间的内在联系。它表明不同的曲率显着影响双曲空间中的距离度量。随着曲率减小,双曲线嵌入距离更能反映树的结构,因为它接近于两个节点的最短路径长度(即双曲线图距离)。当曲率接近零时,双曲嵌入距离接近欧几里得嵌入距离,导致信息的层次结构丢失。

    为了保证这个曲率度量能达到我们的目的,我们首先需要进行定性分析。以前的工作通常使用嵌入空间中测地距离和拓扑距离(最短路径)的乘积失真来衡量信息损失,重点是衡量拓扑信息保留能力。在图表示学习场景中,节点的特征信息和结构信息非常重要。如下图(图2(a),(b))所示,我们使用嵌入距离d和图距离g来衡量图嵌入到双曲空间的扭曲程度。嵌入距离 d 可以认为是两个节点之间的语义距离或特征相似度;图距离g是图中两个节点之间的最短路径的长度。那么,对于双曲曲率,三角形的内角之和小于并且随着曲率参数的减小而减小。此外,对于树状图,两个节点之间的最短路径导航往往更靠近中心,随着曲率参数的减小,这一特性得到增强。根据双曲空间树状图的上述性质,我们可以观察到那个瞬间。

    为了更直观的解释,上图(图2©)呈现了一个具有不同曲率的双曲流形中的简单结构,可以很容易地推广到任何环/网格结构,并且可以在现实中用于描述简单族的三角形交通网络中的关系或循环。通过测量嵌入距离和图距离,我们可以可视化不同曲率下的嵌入失真。

    在此基础上进一步分析曲率是影响模型表达能力的主要因素。最后将双曲图表示学习的自适应问题转化为曲率探索和模型优化的多目标优化问题。

    三、多目标优化问题定义

    我们的目标是在学习 HGNN 的最佳图节点表示的同时最小化嵌入失真。因此,我们将最优曲率选择与 HGNN 优化的结合视为一个多目标优化问题。给定一个带有 label 的图,问题可以定义为:

    然而,在多目标优化中,通常没有唯一的全局最优解。在大多数情况下搜索整个帕累托最优是不可行的,幸运的是,当前的深度强化学习范式为我们提供了启示。我们尝试引入多智能体作为交互式决策者,以有效解决特定下游任务的多目标优化问题。

    四、自适应曲率探索双曲图神经网络

    下图(图3)展示了我们用两个代理解决多目标优化问题的协同强化学习框架,其中自适应曲率探索代理(ACE-Agent)探索曲率以获得更好的对偶曲面表示空间,而双曲图神经网络代理(HGNN-Agent)在特定曲率的双曲空间中学习节点表示。

    ACE-Agent:自适应曲率探索代理

    由于双曲对数映射和黎曼优化的特性,曲率更新的范围非常小(我们在实验中证实了这种现象),同时保证了节点表示的梯度下降方向。在 HGNN 模型中使用反向传播来学习曲率很容易将曲率陷入局部最优。因此,我们的目标是独立设计一个负责自适应曲率探索的代理。ACE-Agent的正式定义如下:

    状态:我们直接用曲率来表示双曲嵌入空间,将强化学习结束时的状态作为最优曲率进行探索。由此,对于该层的 HGNN 模型,我们将 epoch 的状态定义为

    行动:为了最大限度地减少嵌入失真,并探索最佳曲率,我们使用经典的平行四边形定律偏差方法来估计图曲率。对于每个节点,我们执行上述采样时间并将平均值作为新的估计曲率。然后,我们将每个 epoch 的 HGNN-Agent 嵌入结合新的曲率输入到双曲流形中,给定估计曲率和原切空间的权重参数,动作的正式定义如下:

    Reward:我们直接根据具体任务相对于之前状态的收益来定义agent的reward。对于双曲线表示向量和下游任务的评价反馈,奖励定义如下:

    HGNN-Agent:双曲图神经网络代理

    双曲图神经网络代理旨在学习双曲空间中的节点表示,以融合有关图结构和特征的信息。这里我们可以嵌入任意的双曲图神经网络模型,本文使用 HGCN (NeurIPS’19, Stanford)。HGNN在原点的切线空间中对模型每一层的上一层的相邻隐藏特征进行变换聚合,然后将结果映射到具有不同曲率的双曲空间中:

    其中 分别是带曲率的莫比乌斯向量加法和乘法运算, 是双曲非线性激活函数, 是双曲邻域聚合函数。HGNN-Agent的正式定义如下:

    状态:HGNN-Agent 的目标是在给定曲率的双曲空间中学习最优节点表示。给定第 t-1 个 epoch 的曲率和 HGNN 模型的层数,其状态定义为:

    动作:HGNN-Agent 的动作定义为是否通过获取新的曲率来更新学习的嵌入。定义为:

    Reward:与 ACE-Agent 一样,HGNN-Agent 的奖励也是根据特定任务相对于之前状态的性能提升来定义的:

    多智能体强化学习 MARL 和纳什均衡

    我们使用博弈论来解决多个代理问题。具体来说,我们需要 HGNN-Agent 和 ACE-Agent 的合作学习来进行正和博弈,目标是将两个智能体的学习融合到一个纳什均衡(即所有智能体不能更新学习结果独立地提高下游任务的性能)。合作绩效)。我们利用纳什 Q 学习来更新两个代理,并在采取行动时采用具有探索概率的贪婪策略。ACE-Agent和HGNN-Agent共享一个全局状态S,Nash Q-learning优化符合Bellman优化方程如下:

    其中 -function 是学习率,是学习因子。如果 HGNN-Agent 和 ACE-Agent 已经达到纳什平衡,强化学习算法将停止,曲率参数将保持固定,用于下一个训练过程。

    其中, 和 分别是两个智能体的最优策略,上式可以求出最优曲率。

    整体算法如下:

    五、实验验证

    我们进行综合验证,包括引文网络(Cora、Citeseer 和 Pubmed)、超文本网络 (WebKB) 和蛋白质网络 (PPI)。用于比较的基线方法包括欧几里得空间和双曲空间中的神经网络(MLP、HNN)、欧几里得空间中的 GNN(GCN、GAT、GraphSAGE)和双曲空间中的 HGNN(HGCN、κGCN)。总的来说,我们可以得出以下结论:

    1. 我们的 ACE-HGNN 性能良好,在所有数据集上均达到最佳平均性能;

    2. 一般来说基于q学习算法和bp神经网络的倒立摆控制,之前的双曲线模型(HNN、HGCN 和 kGCN)在双曲线较高的数据集上表现更好,但在双曲线较低的数据集上表现较差。

    观察表明,分层拓扑和特征信息的自适应融合是必要的。与使用曲率作为超参数(如 κGCN)或学习参数(如 HGCN)不同,ACE-HGNN 中的自适应曲率探索机制效果更好。

    我们进一步分析嵌入失真、曲率探索和注意力权重,以研究 ACE-HGNN 的表示能力。

    Embedding Distortion:如图所示,ACE-HGNN 在这些模型中平均嵌入失真率最低,表明我们对 ACE-HGNN 的自适应曲率探索可以有效地保留不同图的层次结构。

    曲率探索:在学习过程中,κGCN的曲率被预先估计并保持固定。与 HGCN(几乎是一条略微摆动的直线)相比,我们的 ACE-HGNN 可以在学习期间探索更大范围的曲率。此外,ACE-HGNN 学习的曲率​​最终接近估计的最佳曲率,并自动微调以获得更好的性能。我们还观察到两层的曲率(ACE-HGNN 1 和 ACE-HGNN 2) 是竞争和合作的:

    1. 在连续的几个epoch中,两个HGNN层的曲率往往同时选择相反的动作或者同时保持不变;

    2. 但就整个训练过程的规模而言,两层的总体趋势是一致的。

    可视化和注意力机制:下图(图7)表示Cora数据集中节点嵌入的可视化,ACE-HGNN对不同类和类内相似度有更清晰的区分。我们可以直观地观察到,双曲空间与不适当的曲率会产生“欠拟合”或“过拟合”,这可能会降低下游任务的性能。为了进一步说明曲率对聚合邻居信息的影响,我们在数据集 HGNN-Attention 权重上可视化不同的 δ 用于代理邻居聚合。下图(图 7) 显示在较低 delta 数据集上,中心节点更关心其父节点(注意力层次结构)。

    六、总结

    在本文中,我们提出了 ACE-HGNN,一种新的自适应曲率探索双曲图神经网络。我们是第一个将强化学习引入双曲线图表示学习的工作。对于具有不同层次结构和各种下游任务的图,多智能体强化学习方法可以搜索具有最佳曲率的适当双曲空间,同时学习良好的节点表示。此外,自适应曲率探索还可以直观地合理解释模型学习,反映模型对从图特征或结构信息中学习的偏好。

    本文来自:公众号【ACTBIGDATA】作者:付星宇

    来自icons8的Maria Shukshina的插图

    -结束-

    本周新!

    扫码观看!

    关于我的“门”

    江门是一家专注于发现、加速和投资科技驱动型创业公司的新型风险投资机构。涵盖江门创新服务、江门科技社区和江门创投基金。

    江门成立于2015年底,创始团队由微软创投中国原创始团队打造。为微软精选并深度孵化了126家创新科技创业公司。

    如果您是科技领域的初创公司,您不仅想获得投资,还想获得一系列持续的、有价值的投后服务,欢迎给我发送或推荐项目给“门”:

    bp@thejiangmen.com

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » ACE-HGNN自适应曲率探索的双曲图神经网络

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论