教程:在集群中备份和恢复单个数据库

本教程提供了有关如何在运行的(已升级/迁移)4.x 集群中备份和恢复数据库(在此示例中为版本 3.5)的详细示例。

以下示例假设您的数据库具有与其关联的用户和角色,并描述如何对其进行备份、将其迁移到独立实例,然后在运行的集群中恢复它。有关如何设置集群的更多信息,请参阅 操作手册 → 设置本地集群

在 Neo4j DBMS 中,每个数据库都是单独备份的。因此,为每个数据库规划备份策略非常重要。有关如何为您的设置设计适当的备份策略的更多详细信息,请参阅 操作手册 3.5 → 备份

准备备份数据库

在执行备份之前,最好记下要恢复的数据库的数据和元数据。您可以稍后使用此信息来验证恢复是否成功以及重新创建数据库用户和角色。在此示例中,数据库使用来自 Neo4j 浏览器 → 收藏夹 → 示例图的电影图数据集。

  1. 在运行数据库的 3.5 Neo4j 实例中,导航到 /bin 文件夹并使用您的凭据登录到 Cypher® Shell 命令行控制台。有关 Cypher Shell 命令行界面 (CLI) 及其使用方法的更多信息,请参阅 操作手册 → Cypher Shell

    ./cypher-shell -u neo4j -p <password>
    Connected to Neo4j at neo4j://localhost:7687 as user neo4j.
    Type :help for a list of available commands or :exit to exit the shell.
    Note that Cypher queries must end with a semicolon.
  2. 运行查询以计算数据库中节点的数量。

    MATCH (n) RETURN count(n) AS countNode;
    +-----------+
    | countNode |
    +-----------+
    | 171       |
    +-----------+
    
    1 row available after 22 ms, consumed after another 1 ms
  3. 运行查询以计算关系的数量。

    MATCH (n)-[r]->() RETURN count(r) AS countRelationships;
    +--------------------+
    | countRelationships |
    +--------------------+
    | 253                |
    +--------------------+
    
    1 row available after 29 ms, consumed after another 0 ms
  4. 运行以下两个查询以查看是否定义了模式。

    CALL db.constraints()
    0 rows available after 2 ms, consumed after another 0 ms

    结果显示未定义任何约束。

    CALL db.indexes;
    +----------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
    | description              | indexName | tokenNames | properties | state    | type                  | progress | provider                              | id | failureMessage |
    +----------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
    | "INDEX ON :Movie(title)" | "index_1" | ["Movie"]  | ["title"]  | "ONLINE" | "node_label_property" | 100.0    | {version: "1.0", key: "native-btree"} | 1  | ""             |
    +----------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

    结果显示在 :Movie 节点的 title 属性上定义了一个索引。

  5. 运行查询以列出与该数据库关联的所有用户及其角色。

    CALL dbms.security.listUsers;
    +-----------------------------------------+
    | username | roles                | flags |
    +-----------------------------------------+
    | "user1"  | ["editor", "reader"] | []    |
    | "neo4j"  | ["admin"]            | []    |
    +-----------------------------------------+
    
    2 rows available after 2 ms, consumed after another 0 ms

    结果显示两个用户 - 具有 admin 权限的默认 neo4j 用户,以及具有内置角色 editorreader 的组合权限的自定义用户 user1

  6. 退出 Cypher Shell 命令行控制台。

    :exit;
    
    Bye!

备份数据库

现在您可以准备备份数据库了。

导航到 /bin 文件夹,并运行以下命令以将数据库备份到目标文件夹中。如果要放置备份的文件夹不存在,则必须创建它。在此示例中,它称为 /tmp/3.5.24

./neo4j-admin backup --backup-dir=/tmp/3.5.24 --name=graphdbbackup

有关执行备份和不同命令选项的详细信息,请参阅 操作手册 3.5 → 执行备份

将数据库备份迁移到 4.x 独立实例

要迁移数据库备份并升级其存储,您可以启动一个独立的 Neo4j 实例并使用命令 neo4j-admin restore

必须以 neo4j 用户身份调用 neo4j-admin restore 以确保适当的文件权限。有关更多信息,请参阅 操作手册 → 管理命令

如果在备份数据库时已禁用 --prepare-restore 选项,则在恢复数据库之前必须运行 neo4j-admin prepare-restore 命令。这是为了应用在备份时提取但尚未应用于存储的最新事务。有关更多信息,请参阅 准备要恢复的数据库

  1. 在 4.x 独立实例的 neo4j.conf 文件中,设置 dbms.allow_upgrade=true

  2. 启动服务器。

  3. 导航到 /bin 文件夹并运行以下命令以恢复数据库备份。

    ./neo4j-admin restore --from=/tmp/3.5.24/graphdbbackup --database=graphdbbackup
  4. 运行以下命令以验证数据库 graphdbbackup 是否存在

    ls -al ../data/databases
    total 0
    drwxr-xr-x@  6 username  staff   192  4 Dec 14:15 .
    drwxr-xr-x@  5 username  staff   160  7 Dec 09:35 ..
    drwxr-xr-x  42 username  staff  1344  4 Dec 14:15 graphdbbackup
    drwxr-xr-x  37 username  staff  1184  4 Dec 14:06 neo4j
    -rw-r--r--   1 username  staff     0  4 Dec 14:06 store_lock
    drwxr-xr-x  38 username  staff  1216  4 Dec 14:06 system

    但是,恢复数据库不会自动创建它。因此,如果您在 Cypher Shell 或 Neo4j 浏览器中执行 SHOW DATABASES,则它将不可见。

  5. 登录到 Cypher Shell 命令行控制台。

  6. 将活动数据库更改为 system (:USE system;),并创建 graphdbbackup 数据库。

    CREATE DATABASE graphdbbackup;
    0 rows available after 145 ms, consumed after another 0 ms
  7. 验证 graphdbbackup 数据库是否联机。

    SHOW DATABASES;
    +-------------------------------------------------------------------------------------------------------+
    | name            | address          | role         | requestedStatus | currentStatus | error | default |
    +-------------------------------------------------------------------------------------------------------+
    | "graphdbbackup" | "localhost:7687" | "standalone" | "online"        | "online"      | ""    | FALSE   |
    | "neo4j"         | "localhost:7687" | "standalone" | "online"        | "online"      | ""    | TRUE    |
    | "system"        | "localhost:7687" | "standalone" | "online"        | "online"      | ""    | FALSE   |
    +-------------------------------------------------------------------------------------------------------+
    
    3 rows available after 175 ms, consumed after another 9 ms
  8. 将活动数据库更改为 graphdbbackup,并重复“准备备份数据库”部分中的步骤 2、3 和 4,以验证所有数据是否已成功恢复。

备份已迁移的数据库

要在您的集群中恢复已迁移的数据库,您需要创建它的备份。

导航到 /bin 文件夹,并运行以下命令以将数据库备份到目标文件夹中。如果要放置备份的文件夹不存在,则必须创建它。在此示例中,它称为 /tmp/4.0.11

./neo4j-admin backup --backup-dir=/tmp/4.0.11 --database=graphdbbackup

有关执行备份和不同命令选项的详细信息,请参阅 操作手册 → 备份联机数据库

现在您可以准备将已迁移的数据库备份恢复到运行的集群中了。

在所有集群成员上恢复已迁移的数据库

在每个集群成员上,导航到/bin文件夹,并运行以下命令以恢复已迁移数据库的备份。有关执行恢复和不同命令选项的详细信息,请参阅操作手册 → 恢复命令

./neo4j-admin restore --from=/tmp/4.0.11/graphdbbackup --database=graphdbbackup

然后,在每个集群成员上,运行以下命令以验证数据库graphdbbackup是否存在

ls -al ../data/databases
total 0
drwxr-xr-x@  6 username  staff   192  7 Dec 09:41 .
drwxr-xr-x@  5 username  staff   160  4 Dec 14:17 ..
drwxr-xr-x  38 username  staff  1216  7 Dec 09:41 graphdbbackup
drwxr-xr-x  37 username  staff  1184  7 Dec 08:57 neo4j
-rw-r--r--   1 username  staff     0  4 Dec 14:17 store_lock
drwxr-xr-x  38 username  staff  1216  7 Dec 08:56 system

在集群领导者上创建数据库备份

仅在一个集群成员上使用命令CREATE DATABASE创建数据库备份。该命令会自动路由到领导者,然后路由到其他集群成员。

  1. 在一个集群成员的 Cypher Shell 命令行控制台中,使用system数据库并创建数据库graphdbbackup

    CREATE DATABASE graphdbbackup;
    0 rows available after 132 ms, consumed after another 0 ms
  2. 验证graphdbbackup数据库在所有成员上是否联机。

    SHOW DATABASES;
    +-----------------------------------------------------------------------------------------------------+
    | name            | address          | role       | requestedStatus | currentStatus | error | default |
    +-----------------------------------------------------------------------------------------------------+
    | "graphdbbackup" | "localhost:7689" | "follower" | "online"        | "online"      | ""    | FALSE   |
    | "graphdbbackup" | "localhost:7688" | "leader"   | "online"        | "online"      | ""    | FALSE   |
    | "graphdbbackup" | "localhost:7687" | "follower" | "online"        | "online"      | ""    | FALSE   |
    | "neo4j"         | "localhost:7689" | "leader"   | "online"        | "online"      | ""    | TRUE    |
    | "neo4j"         | "localhost:7688" | "follower" | "online"        | "online"      | ""    | TRUE    |
    | "neo4j"         | "localhost:7687" | "follower" | "online"        | "online"      | ""    | TRUE    |
    | "system"        | "localhost:7689" | "leader"   | "online"        | "online"      | ""    | FALSE   |
    | "system"        | "localhost:7688" | "follower" | "online"        | "online"      | ""    | FALSE   |
    | "system"        | "localhost:7687" | "follower" | "online"        | "online"      | ""    | FALSE   |
    +-----------------------------------------------------------------------------------------------------+
  3. 将您的活动数据库更改为graphdbbackup,并通过完成准备备份数据库部分的步骤 2、3 和 4 来验证所有数据是否已成功恢复。

重新创建数据库用户和角色

在所有集群成员上,使用您在准备备份数据库部分的步骤 5 中记录的信息以及Cypher 手册 → Cypher 管理命令手动重新创建已恢复数据库的所有用户和角色。

示例 1. 对system数据库运行以下命令以重新创建graphdbbackup数据库的自定义用户和角色。
  1. 创建用户user1

    CREATE USER user1 IF NOT EXISTS
    SET PASSWORD 'password'
    SET STATUS ACTIVE;
  2. 授予用户user1角色reader

    GRANT ROLE reader TO user1;
  3. 授予用户user1角色editor

    GRANT ROLE editor TO user1;
  4. 验证用户user1是否具有与数据库备份中相同的角色。

    SHOW USERS;
    +---------------------------------------------------------------------+
    | user    | roles                | passwordChangeRequired | suspended |
    +---------------------------------------------------------------------+
    | "neo4j" | ["admin"]            | FALSE                  | FALSE     |
    | "user1" | ["editor", "reader"] | TRUE                   | FALSE     |
    +---------------------------------------------------------------------+