节点分类训练流水线

class graphdatascience.pipeline.nc_training_pipeline.NCTrainingPipeline

表示节点分类训练流水线。使用 graphdatascience.GraphDataScience.nc_pipe() 构造此类的实例。

addLogisticRegression(**config: Any) Series[Any]

向流水线添加逻辑回归模型候选。

参数:

**config – 逻辑回归模型的配置。

返回值:

查询结果。

addMLP(**config: Any) Series[Any]

向流水线添加多层感知器模型候选。

参数:

**config – 多层感知器模型的配置。

返回值:

查询结果。

addNodeProperty(procedure_name: str, **config: Any) Series[Any]

向流水线添加节点属性步骤。

参数:
  • procedure_name – 要使用的过程的名称。

  • **config – 节点属性的配置。

返回值:

查询结果。

addRandomForest(**config: Any) Series[Any]

向流水线添加随机森林模型候选。

参数:

**config – 随机森林模型的配置。

返回值:

查询结果。

auto_tuning_config() Series[Any]

获取流水线的自动调整配置。

返回值:

包含自动调整配置的 Series。

configureAutoTuning(**config: Any) Series[Any]

配置流水线的自动调整。

参数:

**config – 自动调整的配置。

返回值:

查询结果。

configureSplit(**config: Any) Series[Any]

配置流水线训练的分割。

参数:

**config – 分割的配置。

返回值:

查询结果。

creation_time() Any

获取流水线的创建时间。

返回值:

流水线的创建时间。

drop(failIfMissing: bool = False) Series[Any]

删除流水线。

参数:

failIfMissing – 如果为 True,则如果流水线不存在,则会抛出错误。

返回值:

查询结果。

exists() bool

检查流水线是否存在。

返回值:

如果流水线存在,则返回 True,否则返回 False。

feature_properties() Series[Any]

获取流水线的特征属性。

返回值:

包含流水线特征属性的 Series。

name() str

获取流水线的名称。

返回值:

流水线的名称。

node_property_steps() DataFrame

获取流水线的节点属性步骤。

返回值:

包含节点属性步骤的 DataFrame。

parameter_space() Series[Any]

获取流水线的参数空间。

返回值:

包含参数空间的 Series。

selectFeatures(node_properties: str | List[str]) Series[Any]

选择用于训练的节点属性。

参数:

node_properties – 用于训练的节点属性。

返回值:

查询结果。

split_config() Series[float]

获取流水线的分割配置。

返回值:

包含分割配置的 Series。

train(G: Graph, **config: Any) Tuple[MODEL_TYPE, Series[Any]]

使用流水线在给定的图上训练模型。

参数:
  • G – 要训练的图。

  • **config – 训练的配置。

返回值:

包含已训练模型和查询结果的元组。

train_estimate(G: Graph, **config: Any) Series[Any]

估算给定图和配置的训练时间。

参数:
  • G – 要训练的图。

  • **config – 训练的配置。

返回值:

查询结果。

type() str

获取管道的类型。

返回值:

管道的类型。它将是 NodeClassificationPipeline、LinkPredictionPipeline 或 NodeRegressionPipeline 之一。