链接预测管道
此功能处于 Beta 阶段。有关功能层级的更多信息,请参阅API 层级。
链接预测是应用于图的常见机器学习任务:训练模型以学习图中节点对之间是否存在关系。更精确地说,机器学习模型的输入是节点对的示例。在训练期间,节点对被标记为相邻或不相邻。
训练管道是三个阶段的序列
-
从图中导出三组节点对:特征集、训练集、测试集。后两者已标记。
-
通过仅使用特征集中的关系在图上运行一系列步骤,为图中的节点添加新属性。
-
训练集和测试集用于训练链接预测管道。通过组合节点对的节点属性来导出链接特征。
对于训练集和测试集,正例从图中的关系中选择。负例从不相邻的节点中采样。
可以配置应包含哪些步骤。这些步骤执行 GDS 算法,这些算法会创建新的节点属性。配置节点属性步骤后,可以定义如何将节点对的节点属性组合成链接特征。训练阶段 (III) 使用交叉验证训练多个模型候选,选择最佳模型,并报告相关的性能指标。
在训练管道后,会创建一个预测模型。该模型包括训练管道中的节点属性步骤和链接特征步骤,并使用它们生成相关特征以预测新关系。该预测模型可用于推断两个不相邻节点之间关系存在的概率。
预测只能使用预测模型(不能使用训练管道)进行。 |
此部分分为以下页面