链接预测管道
此功能处于 beta 级别。有关功能级别的更多信息,请参阅 API 级别。
链接预测是应用于图的常见机器学习任务:训练模型以学习图中节点对之间是否存在关系。更准确地说,机器学习模型的输入是节点对的示例。在训练期间,节点对被标记为相邻或不相邻。
训练管道是三个阶段的序列
-
从图中派生出三组节点对:特征集、训练集和测试集。后两者被标记。
-
通过对仅包含特征集中的关系的图运行一系列步骤,对图中的节点进行新的属性增强。
-
训练集和测试集用于训练链接预测管道。链接特征通过组合节点对的节点属性来推导。
对于训练集和测试集,正例从图中的关系中 选择。负例从不相邻的节点中采样。
可以 配置 上述哪些步骤应包含在内。这些步骤执行创建新节点属性的 GDS 算法。配置节点属性步骤后,可以 定义 如何将节点对的节点属性组合成链接特征。训练阶段 (III) 使用交叉验证训练多个模型候选者,选择最佳模型并报告相关的性能指标。
在 训练管道 后,会创建一个预测模型。该模型包含来自训练管道的节点属性步骤和链接特征步骤,并使用它们为预测新关系生成相关的特征。预测模型可用于推断两个不相邻节点之间关系存在的概率。
预测 只能使用预测模型(不能使用训练管道)进行。 |
本节包含以下页面