COLLECT 子查询

COLLECT 子查询表达式可用于创建包含给定子查询返回的行的列表。

COLLECT 子查询与 COUNT 和 EXISTS 子查询不同之处在于，最终的 RETURN 子句是强制性的。RETURN 子句必须只返回一列。

示例图

以下图用于下方示例

要重新创建图，请针对空的 Neo4j 数据库运行以下查询

CREATE
(andy:Swedish:Person {name: 'Andy', age: 36}),
(timothy:Person {name: 'Timothy', nickname: 'Tim', age: 25}),
(peter:Person {name: 'Peter', nickname: 'Pete', age: 35}),
(andy)-[:HAS_DOG {since: 2016}]->(:Dog {name:'Andy'}),
(timothy)-[:HAS_CAT {since: 2019}]->(:Cat {name:'Mittens'}),
(fido:Dog {name:'Fido'})<-[:HAS_DOG {since: 2010}]-(peter)-[:HAS_DOG {since: 2018}]->(:Dog {name:'Ozzy'}),
(fido)-[:HAS_TOY]->(:Toy{name:'Banana'})

简单的 `COLLECT` 子查询

外部作用域引入的变量可以在 COLLECT 子查询中使用，无需导入。在这方面，COLLECT 子查询与 CALL 子查询不同，后者需要导入。以下查询示例说明了这一点，并输出了名为 Ozzy 的狗的主人

MATCH (person:Person)
WHERE 'Ozzy' IN COLLECT { MATCH (person)-[:HAS_DOG]->(dog:Dog) RETURN dog.name }
RETURN person.name AS name

姓名

姓名
`"Peter"`
行数: 1

"Peter"

行数: 1

带 `WHERE` 子句的 `COLLECT` 子查询

WHERE 子句可以在 COLLECT 子查询内部使用。MATCH 子句和外部作用域引入的变量可以在内部作用域中使用。

MATCH (person:Person)
RETURN person.name as name, COLLECT {
  MATCH (person)-[r:HAS_DOG]->(dog:Dog)
  WHERE r.since > 2017
  RETURN dog.name
} as youngDogs

姓名 youngDogs

姓名	youngDogs
`"Andy"`	`[]`
`"Timothy"`	`[]`
`"Peter"`	`["Ozzy"]`
行数: 3

"Andy"

[]

"Timothy"

[]

"Peter"

["Ozzy"]

行数: 3

带 `UNION` 的 `COLLECT` 子查询

COLLECT 可以与 UNION 子句一起使用。下面的示例通过使用 UNION 子句显示了每个人拥有的宠物名称的集合

MATCH (person:Person)
RETURN
    person.name AS name,
    COLLECT {
        MATCH (person)-[:HAS_DOG]->(dog:Dog)
        RETURN dog.name AS petName
        UNION
        MATCH (person)-[:HAS_CAT]->(cat:Cat)
        RETURN cat.name AS petName
    } AS petNames

姓名 petNames

姓名	petNames
`"Andy"`	`["Andy"]`
`"Timothy"`	`["Mittens"]`
`"Peter"`	`["Ozzy", "Fido"]`
行数: 3

"Andy"

["Andy"]

"Timothy"

["Mittens"]

"Peter"

["Ozzy", "Fido"]

行数: 3

带 `WITH` 的 `COLLECT` 子查询

来自外部作用域的变量对于整个子查询都是可见的，即使在使用 WITH 子句时也是如此。为了避免混淆，不允许对这些变量进行遮蔽。当内部作用域中新引入的变量与外部作用域中已定义的变量同名时，就会发生遮蔽。在以下示例中，外部变量 name 被遮蔽，因此会引发错误。

WITH 'Peter' as name
MATCH (person:Person {name: name})
RETURN COLLECT {
    WITH 'Ozzy' AS name
    MATCH (person)-[r:HAS_DOG]->(d:Dog {name: name})
    RETURN d.name
} as dogsOfTheYear

错误消息

The variable `name` is shadowing a variable with the same name from the outer scope and needs to be renamed (line 4, column 20 (offset: 92))

新变量可以引入到子查询中，只要它们使用不同的标识符。在下面的示例中，WITH 子句引入了一个新变量。请注意，主查询中引用的外部作用域变量 person 在 WITH 子句之后仍然可用。

MATCH (person:Person)
RETURN person.name AS name, COLLECT {
    WITH 2018 AS yearOfTheDog
    MATCH (person)-[r:HAS_DOG]->(d:Dog)
    WHERE r.since = yearOfTheDog
    RETURN d.name
} as dogsOfTheYear

姓名 dogsOfTheYear

姓名	dogsOfTheYear
`"Andy"`	`[]`
`"Timothy"`	`[]`
`"Peter"`	`["Ozzy"]`
行数: 3

"Andy"

[]

"Timothy"

[]

"Peter"

["Ozzy"]

行数: 3

在其他子句中使用 `COLLECT` 子查询

COLLECT 可以在查询中的任何位置使用，管理命令除外，其中 COLLECT 表达式受到限制。请参阅下面几个示例，说明如何在查询中不同位置使用 COLLECT

在 `RETURN` 中使用 `COLLECT`

MATCH (person:Person)
RETURN person.name,
       COLLECT {
            MATCH (person)-[:HAS_DOG]->(d:Dog)
            MATCH (d)-[:HAS_TOY]->(t:Toy)
            RETURN t.name
       } as toyNames

person.name toyNames

person.name	toyNames
`"Andy"`	`[]`
`"Timothy"`	`[]`
`"Peter"`	`["Banana"]`
行数: 3

"Andy"

[]

"Timothy"

[]

"Peter"

["Banana"]

行数: 3

在 `SET` 中使用 `COLLECT`

MATCH (person:Person) WHERE person.name = "Peter"
SET person.dogNames = COLLECT { MATCH (person)-[:HAS_DOG]->(d:Dog) RETURN d.name }
RETURN person.dogNames as dogNames

dogNames

dogNames
`["Ozzy", "Fido"]`
行数: 1 已设置属性：1

["Ozzy", "Fido"]

行数: 1
已设置属性：1

在 `CASE` 中使用 `COLLECT`

MATCH (person:Person)
RETURN
   CASE
     WHEN COLLECT { MATCH (person)-[:HAS_DOG]->(d:Dog) RETURN d.name } = []  THEN "No Dogs " + person.name
     ELSE person.name
   END AS result

result

result
`"Andy"`
`"No Dogs Timothy"`
`"Peter"`
行数: 3

"Andy"

"No Dogs Timothy"

"Peter"

行数: 3

将 `COLLECT` 用作分组键

以下查询按狗的名称收集所有人员，然后计算每个组的平均年龄。

MATCH (person:Person)
RETURN COLLECT { MATCH (person)-[:HAS_DOG]->(d:Dog) RETURN d.name } AS dogNames,
       avg(person.age) AS averageAge
 ORDER BY dogNames

dogNames averageAge

dogNames	averageAge
`[]`	`25.0`
`["Andy"]`	`36.0`
`["Ozzy", "Fido"]`	`35.0`
行数: 3

[]

25.0

["Andy"]

36.0

["Ozzy", "Fido"]

35.0

行数: 3

使用 `COLLECT` 与 `collect()`

COLLECT 处理 null 值的方式与聚合函数 collect() 不同。collect() 函数会自动移除 null 值。COLLECT 不会自动移除 null 值。但是，可以通过在子查询中添加过滤步骤来移除它们。

以下查询说明了这些差异

MATCH (p:Person)
RETURN collect(p.nickname) AS names

names

names
`["Pete", "Tim"]`
行数: 1

["Pete", "Tim"]

行数: 1

RETURN COLLECT {
        MATCH (p:Person)
        RETURN p.nickname ORDER BY p.nickname
      } AS names

names

names
`["Pete", "Tim", null]`
行数: 1

["Pete", "Tim", null]

行数: 1

RETURN COLLECT {
        MATCH (p:Person)
        WHERE p.nickname IS NOT NULL
        RETURN p.nickname ORDER BY p.nickname
      } AS names

姓名

姓名
`["Pete", "Tim"]`
行数: 1

["Pete", "Tim"]

行数: 1

规则

对于 COLLECT 子查询，以下内容适用

允许任何非写入查询。
使用 COLLECT 子查询时，最终的 RETURN 子句是强制性的。RETURN 子句必须只返回一列。
COLLECT 子查询可以出现在查询中任何表达式有效的位置。
在外部作用域中定义的任何变量都可以在 COLLECT 子查询自身的作用域中引用。
在 COLLECT 子查询内部引入的变量不属于外部作用域，因此不能在外部访问。

COLLECT 子查询

示例图

简单的 COLLECT 子查询

带 WHERE 子句的 COLLECT 子查询

带 UNION 的 COLLECT 子查询

带 WITH 的 COLLECT 子查询

在其他子句中使用 COLLECT 子查询

在 RETURN 中使用 COLLECT

在 SET 中使用 COLLECT

在 CASE 中使用 COLLECT

将 COLLECT 用作分组键

使用 COLLECT 与 collect()

规则

简单的 `COLLECT` 子查询

带 `WHERE` 子句的 `COLLECT` 子查询

带 `UNION` 的 `COLLECT` 子查询

带 `WITH` 的 `COLLECT` 子查询

在其他子句中使用 `COLLECT` 子查询

在 `RETURN` 中使用 `COLLECT`

在 `SET` 中使用 `COLLECT`

在 `CASE` 中使用 `COLLECT`

将 `COLLECT` 用作分组键

使用 `COLLECT` 与 `collect()`