独热编码

独热编码功能用于将分类数据转换为可供机器学习库使用的数值格式。

此功能处于 Alpha 阶段。有关功能阶段的更多信息,请参阅 API 阶段

独热编码示例

独热编码将返回一个与 可用值 长度相同的列表。在该列表中,选定值1 表示,而 未选定值0 表示。

以下将在硬编码列表上运行算法
RETURN gds.alpha.ml.oneHotEncoding(['Chinese', 'Indian', 'Italian'], ['Italian']) AS value
表 1. 结果

[0,0,1]

以下将创建一个示例图
CREATE (french:Cuisine {name:'French'}),
       (italian:Cuisine {name:'Italian'}),
       (indian:Cuisine {name:'Indian'}),

       (zhen:Person {name: "Zhen"}),
       (praveena:Person {name: "Praveena"}),
       (michael:Person {name: "Michael"}),
       (arya:Person {name: "Arya"}),

       (praveena)-[:LIKES]->(indian),
       (zhen)-[:LIKES]->(french),
       (michael)-[:LIKES]->(french),
       (michael)-[:LIKES]->(italian)
以下将返回每个用户及其喜欢的菜肴类型的独热编码
MATCH (cuisine:Cuisine)
WITH cuisine
  ORDER BY cuisine.name
WITH collect(cuisine) AS cuisines
MATCH (p:Person)
RETURN p.name AS name, gds.alpha.ml.oneHotEncoding(cuisines, [(p)-[:LIKES]->(cuisine) | cuisine]) AS value
  ORDER BY name
表 2. 结果
名称

Arya

[0,0,0]

Michael

[1,0,1]

Praveena

[0,1,0]

Zhen

[1,0,0]

表 3. 参数
名称 类型 默认值 可选 描述

availableValues

列表

可用值。如果为空,函数将返回一个空列表。

selectedValues

列表

选定值。如果为空,函数将返回一个全为 0 的列表。

表 4. 结果
类型 描述

列表

选定值的独热编码。

© . All rights reserved.