独热编码
独热编码功能用于将分类数据转换为可供机器学习库使用的数值格式。
此功能处于 Alpha 阶段。有关功能阶段的更多信息,请参阅 API 阶段。
独热编码示例
独热编码将返回一个与 可用值
长度相同的列表。在该列表中,选定值
用 1
表示,而 未选定值
用 0
表示。
以下将在硬编码列表上运行算法
RETURN gds.alpha.ml.oneHotEncoding(['Chinese', 'Indian', 'Italian'], ['Italian']) AS value
值 |
---|
[0,0,1] |
以下将创建一个示例图
CREATE (french:Cuisine {name:'French'}),
(italian:Cuisine {name:'Italian'}),
(indian:Cuisine {name:'Indian'}),
(zhen:Person {name: "Zhen"}),
(praveena:Person {name: "Praveena"}),
(michael:Person {name: "Michael"}),
(arya:Person {name: "Arya"}),
(praveena)-[:LIKES]->(indian),
(zhen)-[:LIKES]->(french),
(michael)-[:LIKES]->(french),
(michael)-[:LIKES]->(italian)
以下将返回每个用户及其喜欢的菜肴类型的独热编码
MATCH (cuisine:Cuisine)
WITH cuisine
ORDER BY cuisine.name
WITH collect(cuisine) AS cuisines
MATCH (p:Person)
RETURN p.name AS name, gds.alpha.ml.oneHotEncoding(cuisines, [(p)-[:LIKES]->(cuisine) | cuisine]) AS value
ORDER BY name
名称 | 值 |
---|---|
Arya |
[0,0,0] |
Michael |
[1,0,1] |
Praveena |
[0,1,0] |
Zhen |
[1,0,0] |
名称 | 类型 | 默认值 | 可选 | 描述 |
---|---|---|---|---|
|
列表 |
空 |
是 |
可用值。如果为空,函数将返回一个空列表。 |
|
列表 |
空 |
是 |
选定值。如果为空,函数将返回一个全为 0 的列表。 |
类型 | 描述 |
---|---|
|
选定值的独热编码。 |