链接预测管道

此功能处于 beta 级别。有关功能级别的更多信息,请参阅 API 级别

链接预测是应用于图的常见机器学习任务:训练模型以学习图中节点对之间是否存在关系。更准确地说,机器学习模型的输入是节点对的示例。在训练期间,节点对被标记为相邻或不相邻。

在 GDS 中,我们有链接预测管道,它们提供了一个端到端工作流程,从特征提取到链接预测。训练管道位于 管道目录 中。当训练管道被 执行 时,会创建一个预测模型并存储在 模型目录 中。

训练管道是三个阶段的序列

  1. 从图中派生出三组节点对:特征集、训练集和测试集。后两者被标记。

  2. 通过对仅包含特征集中的关系的图运行一系列步骤,对图中的节点进行新的属性增强。

  3. 训练集和测试集用于训练链接预测管道。链接特征通过组合节点对的节点属性来推导。

对于训练集和测试集,正例从图中的关系中 选择。负例从不相邻的节点中采样。

可以 配置 上述哪些步骤应包含在内。这些步骤执行创建新节点属性的 GDS 算法。配置节点属性步骤后,可以 定义 如何将节点对的节点属性组合成链接特征。训练阶段 (III) 使用交叉验证训练多个模型候选者,选择最佳模型并报告相关的性能指标。

训练管道 后,会创建一个预测模型。该模型包含来自训练管道的节点属性步骤和链接特征步骤,并使用它们为预测新关系生成相关的特征。预测模型可用于推断两个不相邻节点之间关系存在的概率。

预测 只能使用预测模型(不能使用训练管道)进行。

本节包含以下页面