Dijkstra 单源最短路径
引言
Dijkstra 最短路径算法计算节点之间的最短路径。该算法支持带有正关系权重的加权图。Dijkstra 单源算法计算源节点与该节点可达的所有节点之间的最短路径。要计算源节点和目标节点之间的最短路径,可以使用Dijkstra 源-目标。
面向 Snowflake 的图形分析实现基于原始描述,并使用二叉堆作为优先队列。
语法
本节介绍执行 Dijkstra 算法所用的语法。
CALL Neo4j_Graph_Analytics.graph.dijkstra_single_source(
'CPU_X64_XS', (1)
{
['defaultTablePrefix': '...',] (2)
'project': {...}, (3)
'compute': {...}, (4)
'write': {...} (5)
}
);
1 | 计算池选择器。 |
2 | 表引用的可选前缀。 |
3 | 项目配置。 |
4 | 计算配置。 |
5 | 写入配置。 |
名称 | 类型 | 默认值 | 可选 | 描述 |
---|---|---|---|---|
computePoolSelector |
字符串 |
|
否 |
用于运行中间度中心性作业的计算池选择器。 |
configuration |
映射 |
|
否 |
用于图项目、算法计算和结果写回的配置。 |
配置映射包含以下三个条目。
有关以下项目配置的更多详细信息,请参阅项目文档。 |
名称 | 类型 |
---|---|
nodeTables |
节点表列表。 |
relationshipTables |
关系类型到关系表的映射。 |
名称 | 类型 | 默认值 | 可选 | 描述 |
---|---|---|---|---|
mutateProperty |
字符串 |
|
是 |
将写回 Snowflake 数据库的关系属性。 |
mutateRelationshipType |
字符串 |
|
是 |
用于写回 Snowflake 数据库的关系类型。 |
sourceNode |
整数或字符串 |
|
否 |
源节点标识符。 |
sourceNodeTable |
字符串 |
|
否 |
用于映射源节点标识符的表。 |
relationshipWeightProperty |
字符串 |
|
是 |
用作权重的关系属性的名称。如果未指定,算法将按未加权运行。 |
有关以下写入配置的更多详细信息,请参阅写入文档。 |
名称 | 类型 | 默认值 | 可选 | 描述 |
---|---|---|---|---|
sourceLabel |
字符串 |
|
否 |
内存图中要写回的关系的起始节点的节点标签。 |
targetLabel |
字符串 |
|
否 |
内存图中要写回的关系的结束节点的节点标签。 |
outputTable |
字符串 |
|
否 |
Snowflake 数据库中写入关系的表。 |
relationshipType |
字符串 |
|
是 |
将写回 Snowflake 数据库的关系类型。 |
relationshipProperty |
字符串 |
|
是 |
将写回 Snowflake 数据库的关系属性。 |
示例
现在我们将看看如何将 Dijkstra 应用于道路网络。
CREATE OR REPLACE TABLE EXAMPLE_DB.DATA_SCHEMA.locations (NODEID STRING);
INSERT INTO EXAMPLE_DB.DATA_SCHEMA.locations VALUES
('A'),
('B'),
('C'),
('D'),
('E'),
('F');
CREATE OR REPLACE TABLE EXAMPLE_DB.DATA_SCHEMA.roads (SOURCENODEID STRING, TARGETNODEID STRING, COST DOUBLE);
INSERT INTO EXAMPLE_DB.DATA_SCHEMA.roads VALUES
('A', 'B', 50),
('A', 'C', 50),
('A', 'D', 100),
('B', 'D', 40),
('C', 'D', 40),
('C', 'E', 80),
('D', 'E', 30),
('D', 'F', 80),
('E', 'F', 40);
此图构建了一个位置之间的道路交通网络。与现实世界中一样,图中的道路具有不同的长度。这些长度由 cost
关系属性表示。
在以下示例中,我们将演示如何使用此图应用 Dijkstra 最短路径算法。
运行作业
运行 Dijkstra 作业包括三个步骤:项目、计算和写入。
CALL Neo4j_Graph_Analytics.graph.dijkstra_single_source('CPU_X64_XS', {
'defaultTablePrefix': 'EXAMPLE_DB.DATA_SCHEMA',
'project': {
'nodeTables': [ 'LOCATIONS' ],
'relationshipTables': {
'roads': {
'sourceTable': 'LOCATIONS',
'targetTable': 'LOCATIONS'
}
}
},
'compute': {
'sourceNode': 'A',
'sourceNodeTable': 'LOCATIONS',
'relationshipWeightProperty': 'COST'
},
'write': [{
'sourceLabel': 'LOCATIONS',
'targetLabel': 'LOCATIONS',
'outputTable': 'PATHS'
}]
});
作业 ID | 作业开始 | 作业结束 | 作业结果 |
---|---|---|---|
job_82537e4136794bc da31286a0c8807397 |
2025-05-06 08:38:55.301000 |
2025-05-06 08:39:01.830000 |
{ "dijkstra_single_source_1": { "computeMillis": 14, "configuration": { "concurrency": 6, "jobId": "cffa031c-8324-40f7-a940-cecb66f0957b", "logProgress": true, "mutateRelationshipType": "PATH", "nodeLabels": [ "*" ], "relationshipTypes": [ "*" ], "relationshipWeightProperty": "COST", "sourceNode": "A", "sourceNodeTable": "EXAMPLE_DB.DATA_SCHEMA.LOCATIONS", "sudo": false }, "mutateMillis": 0, "postProcessingMillis": 0, "preProcessingMillis": 8 }, "project_1": { "graphName": "snowgraph", "nodeCount": 6, "nodeMillis": 123, "relationshipCount": 9, "relationshipMillis": 325, "totalMillis": 448 }, "write_relationship_type_1": { "exportMillis": 1619, "outputTable": "EXAMPLE_DB.DATA_SCHEMA.PATHS", "relationshipProperty": "[SOURCENODEID, TARGETNODEID, NODEIDS, NODELABELS, COSTS, TOTALCOST]", "relationshipType": "PATH", "relationshipsExported": 0 } } |
返回的结果包含有关作业执行的信息。此外,最短路径已写回 Snowflake 数据库。我们可以这样查询它
SELECT * FROM EXAMPLE_DB.DATA_SCHEMA.PATHS;
这显示了存储在数据库中的计算结果
SOURCENODEID | TARGETNODEID | NODEIDS | NODELABELS | 成本 | 总成本 |
---|---|---|---|---|---|
A |
A |
["A"] |
["LOCATIONS"] |
[0] |
0 |
A |
B |
["A", "B"] |
["LOCATIONS", "LOCATIONS"] |
[0, 50] |
50 |
A |
C |
["A", "C"] |
["LOCATIONS", "LOCATIONS"] |
[0, 50] |
50 |
A |
D |
["A", "B", "D"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90] |
90 |
A |
E |
["A", "B", "D", "E"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90, 120] |
120 |
A |
F |
["A", "B", "D", "E", "F"] |
["LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS", "LOCATIONS"] |
[0, 50, 90, 120, 160] |
160 |
结果显示了节点 A
与图中所有其他可达节点之间最短路径的总成本。它还显示了用于查找最短路径的节点 ID(及其标签)的有序列表,以及访问节点的累计成本。这可以在示例图中进行验证。
即使输入图是无向的,写回的关系也始终是有向的。 |