将因果集群升级到 4.2

本节介绍如何升级 Neo4j 因果集群。

您可以通过执行滚动升级或离线升级来升级现有的 Neo4j 因果集群。

每个集群成员都必须完成先决条件和升级步骤。

离线升级

此变体适用于无法进行滚动升级的情况。

建议在类似生产环境的条件下执行测试升级,以了解停机时间的持续时间。

先决条件

  1. 确保您已完成升级清单上的所有任务。

准备升级

  1. 关闭所有集群成员(核心服务器和只读副本)。

  2. 在每个集群成员上执行neo4j-admin unbind以删除集群状态数据。

  3. 在每个实例上安装您要升级到的 Neo4j 版本。有关如何安装您正在使用的发行版的更多信息,请参阅操作手册 4.2 → 安装

  4. neo4j.conf 文件替换为在准备用于新安装的 neo4j.conf 文件一节中为每个实例准备好的文件。

  5. 复制所有用于加密的文件,例如私钥、公共证书以及受信任和已吊销目录的内容(位于 <NEO4J_HOME>/certificates/ 中)。

  6. 通过使用neo4j-admin restore(在线)或neo4j-admin load(离线),根据您的备份方法,在新安装中恢复您的每个数据库和事务,包括system数据库。如果您正在运行 Debian/RPM 发行版,可以跳过此步骤。

    如果您的旧安装修改了以 dbms.directories.* 开头的配置或设置 dbms.default_database,请验证新的 neo4j.conf 文件是否已正确配置以查找这些目录。

  7. 如果您正在使用自定义插件,请确保它们已更新并与新版本兼容,并将它们放置在/plugins 目录中。

升级您的集群

一个核心服务器上
  1. 打开新安装的 neo4j.conf 文件并配置以下设置

  2. 通过从 <NEO4J_HOME> 运行以下命令启动 Neo4j

    bin/neo4j start

    升级在启动期间进行。

  3. 监视 neo4j.log 文件,以获取有关升级将涉及多少步骤以及其进展程度的信息。

  4. 升级完成后,停止服务器。

  5. 打开 neo4j.conf 文件并配置以下设置

  6. 使用neo4j-admin dump 对您的每个数据库和事务(包括 system 数据库)进行转储。

  7. 不要立即启动服务器。

在其他每个核心服务器上
  1. 将您在第一个核心服务器上创建的数据库转储复制到其他每个核心服务器上。

  2. 使用 neo4j-admin load --from=<archive-path> --database=<database> --force 替换您的每个数据库(包括 system 数据库),替换为在第一个核心服务器上升级过的数据库。

  3. 启动每个核心服务器(包括第一个),并验证它们是否加入集群。

对于每个只读副本

启动只读副本并等待其与集群中的其他成员同步。

(可选)虽然空的只读副本最终会从集群的其他成员获取所有数据的完整副本,但此同步过程可能需要一些时间。为了加快此过程,您可以首先使用 neo4j-admin load --from=<archive-path> --database=<database> --force 加载数据,以将您的每个数据库(包括 system 数据库)替换为已升级的数据库。

验证只读副本是否加入集群。

升级后

建议使用空的目标目录执行完整备份

滚动升级

滚动升级是升级因果集群的一种零停机方法。您可以一次升级一个成员,而其他成员则继续运行。但是,如果在滚动升级期间集群失去法定人数且无法恢复,则可能需要停机以进行灾难恢复。

建议
  • 升级过程中的关键点是了解何时可以安全地关闭原始成员。
    强烈建议在每次移除之前监视状态端点,以决定何时以及安全地关闭哪个成员。

  • 为降低滚动升级期间失败的风险,请确保集群在升级期间没有处于高负载状态。如果可能,最安全的方法是完全禁用写入操作。

  • 在滚动升级期间,不应对数据库管理进行任何更改。有关更多信息,请参阅操作手册 4.2 → 管理数据库

固定数量服务器的滚动升级

此变体适用于服务器数量固定且必须原地更新的部署。

对固定数量的服务器执行滚动升级时,无法增加集群大小。因此,在替换成员时,集群的容错级别会降低。

先决条件

  1. 确保您已完成升级清单上的所有任务。

  2. 通过在Cypher® Shell 或 Neo4j Browser 中运行 SHOW DATABASES,验证所有数据库均已在线。离线数据库可以使用 START DATABASE [database-name] 启动。

    在开始滚动升级之前,所有数据库都必须启动。如果您必须在滚动升级期间使某个数据库无法访问,可以使用以下命令禁用对其的访问

    DENY ACCESS ON DATABASE [database-name] TO PUBLIC

    您绝不能运行 DENY ACCESS ON DATABASE system TO PUBLICDENY ACCESS ON DATABASE * TO PUBLIC,因为这会将您锁定在 system 数据库之外。如果您确实被锁定,请按照操作手册中禁用身份验证的步骤进行恢复,并防止外部访问实例或集群。

    从 Neo4j 4.0.x 升级时,您必须禁用对拥有特定数据库访问权限的每个角色的访问,因为 PUBLIC 角色尚未存在。

    DENY ACCESS ON DATABASE [database-name] TO [role1],[role2]

    所有可用角色都可以通过 SHOW ROLES 查询。

  3. 使用以下命令确保在滚动升级期间无法停止、创建或删除数据库

    DENY STOP ON DATABASE * TO PUBLIC
    DENY DATABASE MANAGEMENT ON DBMS TO PUBLIC

    从 Neo4j 4.0.x 升级时,您只能禁用停止数据库的功能。

    DENY STOP ON DATABASE * TO admin

    这必须针对 admin 角色和所有其他具有停止数据库权限的角色执行。有关列出权限的更多信息,请参阅Cypher 手册 4.2 → 图和子图访问控制

升级集群

一次升级一个集群成员,而其余成员继续运行。

如果在滚动升级期间集群失去法定人数且无法恢复,则可能需要停机以进行灾难恢复。

对于每个集群成员
  1. (推荐)使用状态端点中描述的过程来评估移除旧实例是否安全。

  2. 关闭实例。

  3. 安装您要升级到的 Neo4j 版本。有关如何安装您正在使用的发行版的更多信息,请参阅操作手册 4.2 → 安装

  4. neo4j.conf 文件替换为在准备用于新安装的 neo4j.conf 文件中为此实例准备好的文件。

  5. 启动新实例并等待其与集群中的其他成员同步。

  6. 通过使用状态端点,验证新实例是否已成功加入集群并与其余成员同步。

由于只读副本不属于集群共识组,因此在升级期间替换它们不会影响集群的可用性和容错级别。但是,仍然建议逐步添加只读副本,以实现结构化和可维护的升级过程。

升级 system 数据库

在 4.x 版本中,Neo4j 使用共享的 system 数据库,其中包含复杂信息,例如用户、角色及其权限的安全配置。随着 DBMS 功能的增长,system 数据库中包含的图结构会随着 Neo4j 的每个新版本而变化。因此,每次升级 Neo4j 部署时,system 数据库的内容或模式也必须进行转换。在对单个部署或因果集群执行离线升级时,这些更改会自动发生,这是配置 dbms.mode=SINGLE 的结果(请参阅准备升级升级集群)。但是,在执行滚动升级时,您从不使用配置值 dbms.mode=SINGLE 启动实例,即无法自动更新 system 数据库。

Neo4j 2025 中默认启用的指标已更改。
您希望启用的任何特定指标必须metrics.filter 中指定。
有关更多信息,请参阅操作手册 4.2 → 启用指标日志记录

兼容性和同步

对于具有多个实例的因果集群,在依次升级每个实例时,会有一段时间集群由一些旧实例和一些新实例组成。单个 system 数据库在整个集群中一致地复制。因此,不可能使其模式在某些实例上根据新的 Neo4j 版本结构化,而在其他实例上根据旧版本结构化。

system 数据库未与给定实例的 Neo4j 版本同步时,该实例将以兼容模式运行。这意味着两个 Neo4j 版本通用的功能将继续工作,但需要新模式的功能将被禁用。例如,如果您尝试授予旧模式不支持的新权限,您将收到错误并且授予将失败。因此,当滚动升级完成时,您必须手动升级 system 数据库模式才能访问所有新功能。

如果 system 数据库的模式过旧,无法允许兼容模式,则服务器将无法启动。有关更多信息,请参阅故障排除

手动触发 system 数据库升级
  1. 在其中一个集群成员上,调用过程 dbms.upgradeStatus() 以确定是否需要升级

    CALL dbms.upgradeStatus();
    +-------------------------------------------------------------------------------------------------------------------------+
    | status             | description                                                                | resolution            |
    +-------------------------------------------------------------------------------------------------------------------------+
    | "REQUIRES_UPGRADE" | "The sub-graph is supported, but is an older version and requires upgrade" | "CALL dbms.upgrade()" |
    +-------------------------------------------------------------------------------------------------------------------------+

    有关可能的完整状态值列表,请参阅dbms.upgradeStatus 的状态码

  2. 在其中一个集群成员上,通过对 system 数据库调用过程 dbms.upgrade() 来执行升级

    CALL dbms.upgrade();
    +---------------------------+
    | status    | upgradeResult |
    +---------------------------+
    | "CURRENT" | "Success"     |
    +---------------------------+

    由于 Neo4j 使用共享的 system 数据库,升级后的 system 数据库将在整个集群中复制。如果升级因某种原因失败,状态将不会改变,并且 upgradeResult 字段将描述哪些组件未能升级。

升级后步骤

滚动升级后必须执行以下步骤。

  1. 恢复 PUBLIC 角色停止数据库的权限

    REVOKE DENY STOP ON DATABASE * FROM PUBLIC
  2. 恢复 PUBLIC 角色创建和删除数据库的权限

    REVOKE DENY DATABASE MANAGEMENT ON DBMS FROM PUBLIC
  3. (可选)如果您在滚动升级的准备阶段启动了离线数据库并拒绝了某些访问权限,您还应该将其恢复到原始状态

    1. 通过运行以下命令停止每个数据库

      STOP DATABASE [database-name]
    2. 通过运行以下命令重新启用对数据库的访问

      REVOKE DENY ACCESS ON DATABASE [database-name] FROM [role1],[role2]
  4. (推荐)使用空的目标目录执行完整备份

云基础设施的滚动升级

此变体适用于使用可替换云或容器资源的部署。它遵循与固定数量服务器相同的步骤,但您可以在关闭旧成员之前添加新成员,从而保留集群的容错级别。由于只读副本不属于集群共识组,因此在升级期间替换它们不会影响集群的可用性和容错级别。但是,仍然建议逐步添加只读副本,以实现结构化和可维护的升级过程。

© . All rights reserved.