Neo4j Apache Spark 连接器

Neo4j Apache Spark 连接器提供 Neo4j 与 Apache Spark 之间的集成。

您可以使用该连接器在 Neo4j 与其他平台(如 Databricks 和多个 数据仓库)之间处理和传输数据。该连接器基于 Spark DataSource API,支持 Spark 支持的所有编程语言。

图和 DataFrames

连接器使用 模式推断 将 Neo4j 图转换为基于表的 Spark DataFrames。例如,考虑以下模式的图:

Example graph

连接器会创建一个 DataFrame,其中包含通过 BOUGHT 关系连接的 :Customer:Product 节点,以及任何节点或关系属性。模式推断章节展示了此过程的更详细示例,而 数据类型映射章节则展示了 Neo4j 与 Spark 之间的数据类型映射方式。

连接器同样支持将 DataFrames 写入 Neo4j,并支持自定义 Cypher® 查询用于读取写入数据。

兼容性

Neo4j 兼容性

连接器支持 Neo4j 2025.x、5.x 和 4.4,无论是在 Neo4j Aura 作为托管服务运行,还是作为单实例或集群运行。它兼容 Community 版和 Enterprise 版。

Spark 和 Scala 兼容性

该连接器当前支持 Spark 3.3、3.4 和 3.5 版本,以及 Databricks 12.2、13.3、14.3,兼容 Scala 2.12 和 Scala 2.13。

培训

Andrea Santurbano 对该连接器的介绍可在 YouTube 上观看。

许可证

源代码遵循 Apache 2.0 许可证条款提供。您可以自由下载、修改和重新分发该连接器;但 Neo4j 的支持仅限于 Neo4j 官方提供的正式构建版本。

支持

对于 Neo4j Enterprise 和 Neo4j AuraDB 客户,官方发布的此连接器在您现有 Neo4j 支持协议的条款下获得支持。此支持仅适用于正式发布的版本,不包括 alpha、beta 和预发行版。如对支持政策有任何疑问,请联系 Neo4j。

© 2024

© . This site is unofficial and not affiliated with Neo4j, Inc.