链接预测管道

此功能处于 Beta 阶段。有关功能层级的更多信息,请参阅API 层级

链接预测是应用于图的常见机器学习任务:训练模型以学习图中节点对之间是否存在关系。更精确地说,机器学习模型的输入是节点对的示例。在训练期间,节点对被标记为相邻或不相邻。

在 GDS 中,我们有链接预测管道,它提供从特征提取到链接预测的端到端工作流程。训练管道位于管道目录中。当训练管道执行时,会创建一个预测模型并存储在模型目录中。

训练管道是三个阶段的序列

  1. 从图中导出三组节点对:特征集、训练集、测试集。后两者已标记。

  2. 通过仅使用特征集中的关系在图上运行一系列步骤,为图中的节点添加新属性。

  3. 训练集和测试集用于训练链接预测管道。通过组合节点对的节点属性来导出链接特征。

对于训练集和测试集,正例从图中的关系中选择。负例从不相邻的节点中采样。

可以配置应包含哪些步骤。这些步骤执行 GDS 算法,这些算法会创建新的节点属性。配置节点属性步骤后,可以定义如何将节点对的节点属性组合成链接特征。训练阶段 (III) 使用交叉验证训练多个模型候选,选择最佳模型,并报告相关的性能指标。

训练管道后,会创建一个预测模型。该模型包括训练管道中的节点属性步骤和链接特征步骤,并使用它们生成相关特征以预测新关系。该预测模型可用于推断两个不相邻节点之间关系存在的概率。

预测只能使用预测模型(不能使用训练管道)进行。

此部分分为以下页面

© . All rights reserved.