获取正确的结果

示例图

本节使用两个示例数据集。第一个图基于电影数据库。以下代码块可帮助您创建用于探索 Cypher^® 查询的数据

CREATE (matrix:Movie {title: 'The Matrix', released: 1997})
CREATE (cloudAtlas:Movie {title: 'Cloud Atlas', released: 2012})
CREATE (forrestGump:Movie {title: 'Forrest Gump', released: 1994})
CREATE (keanu:Person {name: 'Keanu Reeves', born: 1964})
CREATE (robert:Person {name: 'Robert Zemeckis', born: 1951})
CREATE (tom:Person {name: 'Tom Hanks', born: 1956})
CREATE (tom)-[:ACTED_IN {roles: ['Forrest']}]->(forrestGump)
CREATE (tom)-[:ACTED_IN {roles: ['Zachry']}]->(cloudAtlas)
CREATE (robert)-[:DIRECTED]->(forrestGump)

这是生成的图

第二个数据集是一个小型网络，包含人物、他们工作的公司以及他们喜欢的技术。您可以在以下章节中找到其图片。

筛选结果

到目前为止，您已匹配图中的模式并始终返回找到的所有结果。现在，让我们看看筛选结果的选项，只返回您感兴趣的数据子集。这些筛选条件使用 WHERE 子句表示。此子句允许使用任意数量的布尔表达式，即谓词，与 AND、OR、XOR 和 NOT 结合使用。最简单的谓词是比较；特别是相等性。

MATCH (m:Movie)
WHERE m.title = 'The Matrix'
RETURN m

Rows: 1

+------------------------------------------------+
| m                                              |
+------------------------------------------------+
| (:Movie {title: 'The Matrix', released: 1997}) |
+------------------------------------------------+

上面使用 WHERE 子句的查询，等同于此查询，后者将条件包含在模式匹配中

MATCH (m:Movie {title: 'The Matrix'})
RETURN m

Cypher 的设计旨在灵活，因此通常有不止一种方法来编写查询。

其他选项包括数值比较、匹配正则表达式以及检查列表中是否存在值。

以下示例中的 WHERE 子句包含正则表达式匹配、大于比较以及检查列表中是否存在值的测试

MATCH (p:Person)-[r:ACTED_IN]->(m:Movie)
WHERE p.name =~ 'K.+' OR m.released > 2000 OR 'Neo' IN r.roles
RETURN p, r, m

根据给定的逻辑运算符 OR 和图模式 (p:Person)-[r:ACTED_IN]→(m:Movie)，查询结果必须满足以下要求中的一个

人物的 name 以字母 'K' 开头。
电影在 2000 年之后上映。
角色是 'Neo'。

在我们的例子中，只有第二个条件与图模式 (p:Person)-[r:ACTED_IN]→(m:Movie) 匹配，因此输出如下

Rows: 1

+-------------------------------------------------------------------------------------------------------------------------------+
| p                                         | r                               | m                                               |
+-------------------------------------------------------------------------------------------------------------------------------+
| (:Person {name: 'Tom Hanks', born: 1956}) | [:ACTED_IN {roles: ['Zachry']}] | (:Movie {title: 'Cloud Atlas', released: 2012}) |
+-------------------------------------------------------------------------------------------------------------------------------+

一个高级方面是模式可以作为谓词使用。当 MATCH 扩展匹配模式的数量和形状时，模式谓词会限制当前结果集。它只允许满足指定模式的路径通过。正如您所预期的，使用 NOT 只允许不满足指定模式的路径通过。

MATCH (p:Person)-[:ACTED_IN]->(m)
WHERE NOT (p)-[:DIRECTED]->()
RETURN p, m

Rows: 2

+----------------------------------------------------------------------------------------------+
| p                                         | m                                                |
+----------------------------------------------------------------------------------------------+
| (:Person {name: 'Tom Hanks', born: 1956}) | (:Movie {title: 'Cloud Atlas', released: 2012})  |
| (:Person {name: 'Tom Hanks', born: 1956}) | (:Movie {title: 'Forrest Gump', released: 1994}) |
+----------------------------------------------------------------------------------------------+

在这里，您可以找到具有 ACTED_IN 关系的演员，但跳过那些曾 DIRECTED 任何电影的演员。

还有更高级的筛选方法，例如列表谓词，本节稍后将讨论。

查询值范围

在频繁的查询中，您可能希望查找特定范围内的数据。日期或数字范围可用于检查特定时间线内的事件、年龄值或其他用途。

此标准的语法与 SQL 和其他编程语言中用于检查值范围的逻辑结构非常相似。

以下数据集用于演示这些情况下的 Cypher 查询。

要重现数据集，请运行以下 Cypher 查询

CREATE (diana:Person {name: "Diana"})
CREATE (melissa:Person {name: "Melissa", twitter: "@melissa"})
CREATE (dan:Person {name: "Dan", twitter: "@dan", yearsExperience: 6})
CREATE (sally:Person {name: "Sally", yearsExperience: 4})
CREATE (john:Person {name: "John", yearsExperience: 5})
CREATE (jennifer:Person {name: "Jennifer", twitter: "@jennifer", yearsExperience: 5})
CREATE (joe:Person {name: "Joe"})
CREATE (mark:Person {name: "Mark", twitter: "@mark"})
CREATE (ann:Person {name: "Ann"})
CREATE (xyz:Company {name: "XYZ"})
CREATE (x:Company {name: "Company X"})
CREATE (a:Company {name: "Company A"})
CREATE (Neo4j:Company {name: "Neo4j"})
CREATE (abc:Company {name: "ABC"})
CREATE (query:Technology {type: "Query Languages"})
CREATE (etl:Technology {type: "Data ETL"})
CREATE (integrations:Technology {type: "Integrations"})
CREATE (graphs:Technology {type: "Graphs"})
CREATE (dev:Technology {type: "Application Development"})
CREATE (java:Technology {type: "Java"})
CREATE (diana)-[:LIKES]->(query)
CREATE (melissa)-[:LIKES]->(query)
CREATE (dan)-[:LIKES]->(etl)<-[:LIKES]-(melissa)
CREATE (xyz)<-[:WORKS_FOR]-(sally)-[:LIKES]->(integrations)<-[:LIKES]-(dan)
CREATE (sally)<-[:IS_FRIENDS_WITH]-(john)-[:LIKES]->(java)
CREATE (john)<-[:IS_FRIENDS_WITH]-(jennifer)-[:LIKES]->(java)
CREATE (john)-[:WORKS_FOR]->(xyz)
CREATE (sally)<-[:IS_FRIENDS_WITH]-(jennifer)-[:IS_FRIENDS_WITH]->(melissa)
CREATE (joe)-[:LIKES]->(query)
CREATE (x)<-[:WORKS_FOR]-(diana)<-[:IS_FRIENDS_WITH]-(joe)-[:IS_FRIENDS_WITH]->(mark)-[:LIKES]->(graphs)<-[:LIKES]-(jennifer)-[:WORKS_FOR {startYear: 2017}]->(Neo4j)
CREATE (ann)<-[:IS_FRIENDS_WITH]-(jennifer)-[:IS_FRIENDS_WITH]->(mark)
CREATE (john)-[:LIKES]->(dev)<-[:LIKES]-(ann)-[:IS_FRIENDS_WITH]->(dan)-[:WORKS_FOR]->(abc)
CREATE (ann)-[:WORKS_FOR]->(abc)
CREATE (a)<-[:WORKS_FOR]-(melissa)-[:LIKES]->(graphs)<-[:LIKES]-(diana)

假设您想知道谁拥有三到七年的经验。下面的代码块显示了针对此情况的 Cypher 查询。

MATCH (p:Person)
WHERE 3 <= p.yearsExperience <= 7
RETURN p

测试属性是否存在

您可能只对节点或关系上是否存在属性感兴趣。例如，您可能想检查系统中哪些客户拥有 Twitter 句柄，以便显示相关内容。或者，您可以检查所有员工是否都具有开始日期属性，以验证哪些实体可能需要更新。

请记住：在 Neo4j 中，属性只有在有值时才存在（才存储）。null 属性不存储。这确保了您的节点和关系只保留有价值、必要的信息。

要在 Neo4j v5 中编写此类存在性检查，您需要使用 IS NOT NULL 谓词，以仅包含属性存在的节点或关系。

Cypher 代码在下面的代码块中。

//Query1: find all users who have a twitter property
MATCH (p:Person)
WHERE p.twitter IS NOT NULL
RETURN p.name;

//Query2: find all WORKS_FOR relationships that have a startYear property
MATCH (p:Person)-[rel:WORKS_FOR]->(c:Company)
WHERE rel.startYear IS NOT NULL
RETURN p, rel, c;

查询 1 结果

Rows: 4

+------------------------+
| p.name                 |
+------------------------+
| 'Melissa'              |
| 'Dan'                  |
| 'Jennifer'             |
| 'Mark'                 |
+---------- -------------+

查询 2 结果

cypher filter exists relProp arr

检查字符串 — 部分值、模糊搜索

某些场景需要查询语法能够匹配字符串中的部分值或宽泛类别。要进行此类查询，您需要一些灵活性和选项来进行字符串匹配和搜索。无论您是寻找以特定值开头、结尾或包含特定值的字符串，Cypher 都能够高性能且轻松地处理它。

Cypher 中有几个与 WHERE 子句一起使用的关键字，用于测试字符串属性值。STARTS WITH 关键字允许您检查以指定字符串开头的属性值。通过 CONTAINS 关键字，您可以检查指定字符串是否是属性值的一部分。ENDS_WITH 关键字检查属性字符串的末尾是否存在您指定的值。

每个示例都在下面的 Cypher 代码块中。

//check if a property starts with 'M'
MATCH (p:Person)
WHERE p.name STARTS WITH 'M'
RETURN p.name;

//check if a property contains 'a'
MATCH (p:Person)
WHERE p.name CONTAINS 'a'
RETURN p.name;

//check if a property ends with 'n'
MATCH (p:Person)
WHERE p.name ENDS WITH 'n'
RETURN p.name;

您还可以使用正则表达式来测试字符串的值。例如，您可以查找所有共享同一名字的 Person 节点，或者查找所有具有特定部门代码的类。

让我们看一个例子。

MATCH (p:Person)
WHERE p.name =~ 'Jo.*'
RETURN p.name

Rows: 2

+--------------------------------+
| p.name                         |
+--------------------------------+
| 'John'                         |
| 'Joe'                          |
+--------------------------------+

就像在 SQL 和其他语言中一样，您可以检查属性值是否是列表中的值。IN 关键字允许您指定一个值数组，并根据列表中的每个值验证属性的内容。

这是一个例子

MATCH (p:Person)
WHERE p.yearsExperience IN [1, 5, 6]
RETURN p.name, p.yearsExperience

Rows: 3

+--------------------------------+
| p.name      | p.yearsExp       |
+--------------------------------+
| 'Jennifer'  | 5                |
| 'Dan'       | 6                |
| 'John'      | 5                |
+--------------------------------+

基于模式筛选

图的独特之处在于它专注于关系。正如您可以基于节点标签或属性筛选查询一样，您也可以基于关系或模式筛选结果。这允许您测试模式是否也具有某个特定关系，或者没有，或者是否存在另一个模式。

以下 Cypher 代码展示了如何实现。

//Query1: find which people are friends of someone who works for Neo4j
MATCH (p:Person)-[r:IS_FRIENDS_WITH]->(friend:Person)
WHERE exists((p)-[:WORKS_FOR]->(:Company {name: 'Neo4j'}))
RETURN p, r, friend;

//Query2: find Jennifer's friends who do not work for a company
MATCH (p:Person)-[r:IS_FRIENDS_WITH]->(friend:Person)
WHERE p.name = 'Jennifer'
AND NOT exists((friend)-[:WORKS_FOR]->(:Company))
RETURN friend.name;

查询 1 结果： cypher filter exists ptrn arr

查询 2 结果

Rows: 1

+--------------------------------+
| friend.name                    |
+--------------------------------+
| 'Mark'                         |
+--------------------------------+

可选模式

在某些情况下，您可能希望从模式中检索结果，即使它们不匹配整个模式或所有条件。这与 SQL 中的外连接功能类似。在 Cypher 中，您可以使用 OPTIONAL MATCH 模式尝试匹配，但如果未找到结果，则这些行将返回 null 值。

您可以通过查询姓名以特定字母开头且可能在公司工作的人，来查看这在 Cypher 中是如何实现的。

//Find all people whose name starts with J and who may work for a company.
MATCH (p:Person)
WHERE p.name STARTS WITH 'J'
OPTIONAL MATCH (p)-[:WORKS_FOR]-(other:Company)
RETURN p.name, other.name;

Rows: 3

+--------------------------------+
| p.name      | other.name       |
+--------------------------------+
| 'Jennifer'  | 'Neo4j'          |
| 'John'      | 'XYZ'            |
| 'Joe'       | null             |
+--------------------------------+

请注意，Joe 被返回了，因为他的名字以字母 'J' 开头，但他公司的名称是 null。这是因为他与 COMPANY 节点没有 WORKS_FOR 关系。由于您使用了 OPTIONAL MATCH，他的 Person 节点仍然从第一次匹配中返回，但第二次匹配未找到，因此返回 null。

要查看差异，请尝试在第二次匹配前不使用 OPTIONAL 运行查询。您可以看到 Joe 的行不再返回。这是因为 Cypher 将语句解读为 AND 匹配，因此该人物必须同时匹配第一个条件（姓名以 'J' 开头）和第二个条件（人物在公司工作）。

更复杂的模式

即使在这一点上，您也能够处理许多简单的图查询。但是，当您想将模式扩展到单个关系之外时会发生什么？如果您想知道除了 Jennifer 之外还有谁喜欢图呢？

我们通过简单地添加到我们的第一个模式或匹配额外的模式来处理此功能以及许多其他功能。让我们看几个例子。

//Query1: find who likes graphs besides Jennifer
MATCH (j:Person {name: 'Jennifer'})-[r:LIKES]-(graph:Technology {type: 'Graphs'})-[r2:LIKES]-(p:Person)
RETURN p.name;

//Query2: find who likes graphs besides Jennifer that she is also friends with
MATCH (j:Person {name: 'Jennifer'})-[:LIKES]->(:Technology {type: 'Graphs'})<-[:LIKES]-(p:Person),
      (j)-[:IS_FRIENDS_WITH]-(p)
RETURN p.name;

查询 1 结果

Rows: 3

+-----------------------+
| p.name                |
+-----------------------+
| 'Diana'               |
| 'Mark'                |
| 'Melissa'             |
+-----------------------+

查询 2 结果

Rows: 2

+-----------------------+
| p.name                |
+-----------------------+
| 'Mark'                |
| 'Melissa'             |
+-----------------------+

请注意，在第二个查询中，第一个 MATCH 行后面使用了逗号，并在下一行添加了另一个要匹配的模式。这允许您将模式链接在一起，类似于您上面使用 WHERE exists(<pattern>) 语法的方式。通过这种结构，您可以添加多个不同的模式并将它们链接在一起，从而允许您使用某些模式遍历图的不同部分。

返回结果

到目前为止，您已经直接通过变量返回了节点、关系和路径。但是，RETURN 子句可以返回任意数量的表达式。那么 Cypher 中的表达式是什么呢？

最简单的表达式是字面值。字面值的例子有：数字、字符串、数组（例如：[1,2,3]）和映射（例如：{name: 'Tom Hanks', born:1964, movies: ['Forrest Gump', ...], count: 13}）。任何节点、关系或映射的单个属性都可以使用点语法访问，例如：n.name。数组的单个元素或切片可以通过下标检索，例如：names[0] 和 movies[1..-1]。每个函数求值，例如：length(array)、toInteger('12')、substring('2014-07-01', 0, 4) 和 coalesce(p.nickname, 'n/a')，也都是一个表达式。

WHERE 子句中使用的谓词算作布尔表达式。

简单的表达式可以组合和连接以形成更复杂的表达式。

默认情况下，表达式本身用作列的标签，在许多情况下，您希望使用 expression AS alias 为其起一个更易理解的别名。该别名随后可用于引用该列。

MATCH (p:Person)
RETURN
  p,
  p.name AS name,
  toUpper(p.name),
  coalesce(p.nickname, 'n/a') AS nickname,
  {name: p.name, label: head(labels(p))} AS person

Rows: 3

+-------------------------------------------------------------------------------------------------------------------------------------------------+
| p                                               | name              | toUpper(p.name)   | nickname | person                                     |
+-------------------------------------------------------------------------------------------------------------------------------------------------+
| (:Person {name: 'Keanu Reeves', born: 1964})    | 'Keanu Reeves'    | 'KEANU REEVES'    | 'n/a'    | {name: 'Keanu Reeves', label: 'Person'}    |
| (:Person {name: 'Robert Zemeckis', born: 1951}) | 'Robert Zemeckis' | 'ROBERT ZEMECKIS' | 'n/a'    | {name: 'Robert Zemeckis', label: 'Person'} |
| (:Person {name: 'Tom Hanks', born: 1956})       | 'Tom Hanks'       | 'TOM HANKS'       | 'n/a'    | {name: 'Tom Hanks', label: 'Person'}       |
+-------------------------------------------------------------------------------------------------------------------------------------------------+

如果您只想显示唯一结果，可以在 RETURN 之后使用 DISTINCT 关键字

MATCH (n)
RETURN DISTINCT labels(n) AS Labels

Rows: 2

+------------+
| Labels     |
+------------+
| ['Movie']  |
| ['Person'] |
+------------+

返回唯一结果

您可以使用 Cypher 中的 DISTINCT 关键字返回唯一结果。您的某些查询可能会因为到节点的多条路径或满足多个条件的节点而返回重复结果。这种冗余会使结果混乱，并使筛选长列表以找到所需内容变得困难。

要去除重复实体，您可以使用 DISTINCT 关键字。

//Query: find people who have a twitter and like graphs or query languages
MATCH (user:Person)
WHERE user.twitter IS NOT null
WITH user
MATCH (user)-[:LIKES]-(t:Technology)
WHERE t.type IN ['Graphs','Query Languages']
RETURN DISTINCT user.name

查询结果

Rows: 3

+-----------------------+
| user.name             |
+-----------------------+
| 'Jennifer'            |
| 'Melissa'             |
| 'Mark'                |
+-----------------------+

对于前面的查询，用例是您正在启动一个关于 Cypher 技巧和窍门的新 Twitter 账户，并且您希望通知拥有 Twitter 账户并喜欢图或查询语言的用户。查询的前两行查找具有 Twitter 句柄的 Person 节点。然后，您使用 WITH 将这些用户传递到下一个 MATCH，在那里您找出该人物是否喜欢图或查询语言。请注意，在不使用 DISTINCT 关键字的情况下运行此语句会导致“Melissa”显示两次。这是因为她喜欢图，也喜欢查询语言。当使用 DISTINCT 时，您只检索唯一用户。

限制结果数量

有时您需要一个抽样集，或者您只想一次拉取这么多结果进行更新或处理。LIMIT 关键字获取查询的输出，并根据您指定的数量限制返回的体积。

例如，您可以在我们的图中找到每个人拥有的朋友数量。如果图中有数千或数百万个节点和关系，返回的结果数量将是巨大的。如果您只关心朋友最多的前三个人呢？让我们为此编写一个查询！

//Query: find the top 3 people who have the most friends
MATCH (p:Person)-[r:IS_FRIENDS_WITH]-(other:Person)
RETURN p.name, count(other.name) AS numberOfFriends
ORDER BY numberOfFriends DESC
LIMIT 3

Rows: 3

+--------------------------------+
| p.name      | numberOfFriends  |
+--------------------------------+
| 'Jennifer'  | 5                |
| 'Mark'      | 2                |
| 'Ann'       | 2                |
+--------------------------------+

该查询提取人物及其连接的朋友，并返回人物姓名和朋友数量。您可以只运行查询的这部分，返回一个混乱的姓名和朋友数量列表，但您可能希望根据每个人拥有的朋友数量（从最大数量开始排在顶部 (DESC)）对列表进行排序。您也可以运行查询的这部分来查看按顺序排列的朋友和数量，但在上面的示例中，图表中已提取出拥有最多朋友的前三个人。LIMIT 从有序列表中提取顶部结果。

尝试通过删除 ORDER BY 和 LIMIT 行，然后分别添加它们来混合查询。请注意，仅删除 ORDER BY 行会从列表中拉取起始的三个值，从而获得返回结果的随机抽样。

聚合信息

在许多情况下，我们希望在遍历图中的模式时聚合或分组所遇到的数据。在 Cypher 中，聚合发生在 RETURN 子句中，同时计算最终结果。支持许多常见的聚合函数，例如 count、sum、avg、min 和 max，但还有更多。

电影数据库中人物数量的统计可以通过以下方式实现

MATCH (:Person)
RETURN count(*) AS people

Rows: 1

+--------+
| people |
+--------+
| 3      |
+--------+

如果您想跳过 null 值，请使用函数 count(variable)。

对于只聚合唯一值，请使用 DISTINCT 运算符，例如：count(DISTINCT role)。

聚合在 Cypher 中隐式工作。您指定要聚合的结果列。Cypher 将所有未聚合的列用作分组键。

聚合会影响在排序或后续查询部分中仍然可见的数据。

以下语句查找演员和导演合作的频率

MATCH (actor:Person)-[:ACTED_IN]->(movie:Movie)<-[:DIRECTED]-(director:Person)
RETURN actor, director, count(*) AS collaborations

Rows: 1

+--------------------------------------------------------------------------------------------------------------+
| actor                                     | director                                        | collaborations |
+--------------------------------------------------------------------------------------------------------------+
| (:Person {name: 'Tom Hanks', born: 1956}) | (:Person {name: 'Robert Zemeckis', born: 1951}) | 1              |
+--------------------------------------------------------------------------------------------------------------+

使用 count() 函数有三种不同的方式

count(*)：统计结果并返回匹配行的数量。
count(n)：统计 n 的出现次数（排除 null 值）。您可以在括号内指定节点、关系或属性供 Cypher 计数。
count(DISTINCT variable)：DISTINCT 运算符从结果中删除重复项。

在数据集人物、技术和公司中，一些 Person 节点有 Twitter 句柄，但其他节点没有。如果您运行下面的第一个示例查询，您将看到 twitter 属性对四个人有值，而对其他五个人是 null。第二个和第三个查询展示了如何使用不同的 count 选项。

//Query1: see the list of Twitter handle values for Person nodes
MATCH (p:Person)
RETURN p.twitter;

查询 1 结果

Rows: 9

+--------------+
| p.twitter    |
+--------------+
| '@jennifer'  |
| '@melissa'   |
| null         |
| '@mark'      |
| '@dan'       |
| null         |
| null         |
| null         |
| null         |
+--------------+

//Query2: count of the non-null `twitter` property of the Person nodes
MATCH (p:Person)
RETURN count(p.twitter);

查询 2 结果

Rows: 1

+-------------------+
| count(p.twitter)  |
+-------------------+
| 4                 |
+-------------------+

//Query3: count on the Person nodes
MATCH (p:Person)
RETURN count(*);

查询 3 结果

Rows: 1

+-------------------+
| count(*)          |
+-------------------+
| 9                 |
+-------------------+

收集聚合

一个非常有用的聚合函数是 collect(expression)，它返回一个表达式所返回值的单个聚合列表。这在许多情况下非常有用，因为在聚合时不会丢失任何详细信息。

collect() 非常适合检索典型的父子结构，其中每行返回一个核心实体（父级、根或头部），并将其所有依赖信息存储在通过 collect() 创建的关联列表中。这意味着无需为每个子行重复父级信息，也无需运行 n+1 条语句单独检索父级及其子级。

以下语句可用于检索我们数据库中每部电影的演职人员

MATCH (m:Movie)<-[:ACTED_IN]-(a:Person)
RETURN m.title AS movie, collect(a.name) AS cast, count(*) AS actors

Rows: 2

+-----------------------------------------+
| movie          | cast          | actors |
+-----------------------------------------+
| 'Forrest Gump' | ['Tom Hanks'] | 1      |
| 'Cloud Atlas'  | ['Tom Hanks'] | 1      |
+-----------------------------------------+

由 collect() 创建的列表既可以由使用 Cypher 结果的客户端使用，也可以直接在语句中使用任何列表函数或谓词。

遍历列表值

如果您有一个列表要检查或分离其值，Cypher 提供了 UNWIND 子句。这与 collect() 的作用相反，它将列表分解为单独行中的单个值。

UNWIND 在导入数据时常用于遍历 JSON 和 XML 对象，以及日常数组和其他类型的列表。让我们看几个例子，假设某人喜欢的技术也意味着他们对每种技术都有一些经验。如果您有兴趣雇用熟悉 Graphs 或 Query Languages 的人，您可以编写以下查询来找到要面试的人。

//Query1: for a list of techRequirements, look for people who have each skill
WITH ['Graphs','Query Languages'] AS techRequirements
UNWIND techRequirements AS technology
MATCH (p:Person)-[r:LIKES]-(t:Technology {type: technology})
RETURN t.type, collect(p.name) AS potentialCandidates;

查询 1 结果

Rows: 2

+-------------------+------------------------------------------+
| t.type            | potentialCandidates                      |
+-------------------+------------------------------------------+
| 'Graphs'          | ['Diana', 'Mark', 'Melissa', 'Jennifer'] |
| 'Query Languages' | ['Diana', 'Melissa', 'Joe']              |
+-------------------+------------------------------------------+

//Query2: for numbers in a list, find candidates who have that many years of experience
WITH [4, 5, 6, 7] AS experienceRange
UNWIND experienceRange AS number
MATCH (p:Person)
WHERE p.yearsExp = number
RETURN p.name, p.yearsExp;

查询 2 结果

Rows: 4

+--------------+-----------------+
| p.name       | p.yearsExp      |
+--------------+-----------------+
| 'Sally'      | 4               |
| 'Jennifer'   | 5               |
| 'John'       | 5               |
| 'Dan'        | 6               |
+--------------+-----------------+

排序和分页

通常在使用 count(x) 聚合后进行排序和分页。

排序使用 ORDER BY expression [ASC|DESC] 子句完成。表达式可以是任何表达式，只要它可以通过返回的信息计算。

例如，如果您返回 person.name，您仍然可以 ORDER BY person.age，因为两者都可以从 person 引用访问。您不能根据未返回的内容进行排序。这对于聚合和 DISTINCT 返回值尤其重要，因为两者都消除了聚合数据的可见性。

分页使用 SKIP {offset} 和 LIMIT {count} 子句完成。

常见的模式是聚合计数（分数或频率），按其排序，然后只返回前 n 个条目。

例如，要找到最多产的演员，您可以这样做

MATCH (a:Person)-[:ACTED_IN]->(m:Movie)
RETURN a, count(*) AS appearances
ORDER BY appearances DESC LIMIT 10

Rows: 1

+---------------------------------------------------------+
| a                                         | appearances |
+---------------------------------------------------------+
| (:Person {name: 'Tom Hanks', born: 1956}) | 2           |
+---------------------------------------------------------+

排序结果

如果您能根据经验多少对前面示例中的潜在招聘候选人列表进行排序，或者您想根据年龄对所有人员进行排名，那么该列表可能会更有用。

ORDER BY 关键字根据您指定的值按升序或降序（升序是默认值）对结果进行排序。让我们使用我们使用 UNWIND 的示例中的相同查询，看看如何对候选人进行排序。

//Query1: for a list of techRequirements, look for people who have each skill
WITH ['Graphs','Query Languages'] AS techRequirements
UNWIND techRequirements AS technology
MATCH (p:Person)-[r:LIKES]-(t:Technology {type: technology})
WITH t.type AS technology, p.name AS personName
ORDER BY technology, personName
RETURN technology, collect(personName) AS potentialCandidates;

查询 1 结果

Rows: 2

+-------------------+------------------------------------------+
| technology        | potentialCandidates                      |
+-------------------+------------------------------------------+
| 'Graphs'          | ['Diana', 'Jennifer', 'Mark', 'Melissa'] |
| 'Query Languages' | ['Diana', Joe]                           |
+-------------------+------------------------------------------+

//Query2: for numbers in a list, find candidates who have that many years of experience
WITH [4, 5, 6, 7] AS experienceRange
UNWIND experienceRange AS number
MATCH (p:Person)
WHERE p.yearsExp = number
RETURN p.name, p.yearsExp ORDER BY p.yearsExp DESC;

查询 2 结果

Rows: 4

+--------------+-----------------+
| p.name       | p.yearsExp      |
+--------------+-----------------+
| 'Dan'        | 6               |
| 'Jennifer'   | 5               |
| 'John'       | 5               |
| 'Sally'      | 4               |
+--------------+-----------------+

请注意，第一个查询必须先按 Person 姓名排序，然后才能将值收集到列表中。如果您不先排序（将 ORDER BY 放在 RETURN 子句之后），您将根据列表的大小而不是列表中值的第一个字母进行排序。结果也按两个值排序：技术，然后是人。这允许您对技术进行排序，以便所有喜欢某种技术的人都列在一起。

您可以通过运行以下查询来尝试按两个值或一个值排序的区别

//only sorted by person's name in alphabetical order
WITH ['Graphs','Query Languages'] AS techRequirements
UNWIND techRequirements AS technology
MATCH (p:Person)-[r:LIKES]-(t:Technology {type: technology})
WITH t.type AS technology, p.name AS personName
ORDER BY personName
RETURN technology, personName;

//only sorted by technology (person names are out of order)
WITH ['Graphs','Query Languages'] AS techRequirements
UNWIND techRequirements AS technology
MATCH (p:Person)-[r:LIKES]-(t:Technology {type: technology})
WITH t.type AS technology, p.name AS personName
ORDER BY technology
RETURN technology, personName;

//sorted by technology, then by person's name
WITH ['Graphs','Query Languages'] AS techRequirements
UNWIND techRequirements AS technology
MATCH (p:Person)-[r:LIKES]-(t:Technology {type: technology})
WITH t.type AS technology, p.name AS personName
ORDER BY technology, personName
RETURN technology, personName;

统计列表中的值

如果您有一个值列表，您还可以使用 size() 函数查找该列表中的项目数或计算表达式的大小。下面的示例返回找到的项目数。

//Query1: find number of items in collected list
MATCH (p:Person)-[:IS_FRIENDS_WITH]->(friend:Person)
RETURN p.name, size(collect(friend.name)) AS numberOfFriends;

查询 1 结果

Rows: 4

+--------------+-----------------+
| p.name       | numberOfFriends |
+--------------+-----------------+
| 'John'       | 1               |
| 'Jennifer'   | 5               |
| 'Ann'        | 1               |
| 'Joe'        | 2               |
+--------------+-----------------+

在 Neo4j v5 中，如果您需要查找关系模式的数量，请使用 COUNT {} 表达式。请查看以下 Cypher 查询示例。

//Query2: find number of friends who have other friends
MATCH (p:Person)-[:IS_FRIENDS_WITH]->(friend:Person)
WHERE count{(friend)-[:IS_FRIENDS_WITH]-(:Person)} > 1
RETURN p.name, collect(friend.name) AS friends, count{(friend)-[:IS_FRIENDS_WITH]-(:Person)} AS numberOfFoFs;

查询 2 结果

Rows: 3

+--------------+----------------------------------+---------------+
| p.name       | friends                          | numberOfFofs  |
+--------------+----------------------------------+---------------+
| 'Joe'        | ['Mark']                         | 2             |
| 'Jennifer'   | ['Mark', 'John', 'Sally', 'Ann'] | 2             |
| 'John'       | ['Sally']                        | 2             |
+--------------+----------------------------------+---------------+

获取正确的结果

示例图

筛选结果

查询值范围

测试属性是否存在

检查字符串 — 部分值、模糊搜索

基于模式筛选

可选模式

更复杂的模式

返回结果

返回唯一结果

限制结果数量

聚合信息

收集聚合

遍历列表值

排序和分页

排序结果

统计列表中的值

资源