节点分类训练流水线¶
- class graphdatascience.pipeline.nc_training_pipeline.NCTrainingPipeline¶
表示节点分类训练流水线。使用
graphdatascience.GraphDataScience.nc_pipe()
构造此类的实例。- addLogisticRegression(**config: Any) Series[Any] ¶
向流水线添加逻辑回归模型候选。
- 参数:
**config – 逻辑回归模型的配置。
- 返回值:
查询结果。
- addMLP(**config: Any) Series[Any] ¶
向流水线添加多层感知器模型候选。
- 参数:
**config – 多层感知器模型的配置。
- 返回值:
查询结果。
- addNodeProperty(procedure_name: str, **config: Any) Series[Any] ¶
向流水线添加节点属性步骤。
- 参数:
procedure_name – 要使用的过程的名称。
**config – 节点属性的配置。
- 返回值:
查询结果。
- addRandomForest(**config: Any) Series[Any] ¶
向流水线添加随机森林模型候选。
- 参数:
**config – 随机森林模型的配置。
- 返回值:
查询结果。
- auto_tuning_config() Series[Any] ¶
获取流水线的自动调整配置。
- 返回值:
包含自动调整配置的 Series。
- configureAutoTuning(**config: Any) Series[Any] ¶
配置流水线的自动调整。
- 参数:
**config – 自动调整的配置。
- 返回值:
查询结果。
- configureSplit(**config: Any) Series[Any] ¶
配置流水线训练的分割。
- 参数:
**config – 分割的配置。
- 返回值:
查询结果。
- creation_time() Any ¶
获取流水线的创建时间。
- 返回值:
流水线的创建时间。
- drop(failIfMissing: bool = False) Series[Any] ¶
删除流水线。
- 参数:
failIfMissing – 如果为 True,则如果流水线不存在,则会抛出错误。
- 返回值:
查询结果。
- exists() bool ¶
检查流水线是否存在。
- 返回值:
如果流水线存在,则返回 True,否则返回 False。
- feature_properties() Series[Any] ¶
获取流水线的特征属性。
- 返回值:
包含流水线特征属性的 Series。
- name() str ¶
获取流水线的名称。
- 返回值:
流水线的名称。
- node_property_steps() DataFrame ¶
获取流水线的节点属性步骤。
- 返回值:
包含节点属性步骤的 DataFrame。
- parameter_space() Series[Any] ¶
获取流水线的参数空间。
- 返回值:
包含参数空间的 Series。
- selectFeatures(node_properties: str | List[str]) Series[Any] ¶
选择用于训练的节点属性。
- 参数:
node_properties – 用于训练的节点属性。
- 返回值:
查询结果。
- split_config() Series[float] ¶
获取流水线的分割配置。
- 返回值:
包含分割配置的 Series。
- train(G: Graph, **config: Any) Tuple[MODEL_TYPE, Series[Any]] ¶
使用流水线在给定的图上训练模型。
- 参数:
G – 要训练的图。
**config – 训练的配置。
- 返回值:
包含已训练模型和查询结果的元组。
- train_estimate(G: Graph, **config: Any) Series[Any] ¶
估算给定图和配置的训练时间。
- 参数:
G – 要训练的图。
**config – 训练的配置。
- 返回值:
查询结果。
- type() str ¶
获取管道的类型。
- 返回值:
管道的类型。它将是 NodeClassificationPipeline、LinkPredictionPipeline 或 NodeRegressionPipeline 之一。