Neo4j 研究
欢迎来到 Neo4j 研究,我们将科学转化为技术。
在 Neo4j,我们构建令用户满意的图数据产品,并努力始终超越客户期望。我们的产品建立在计算机科学研究和扎实工程的丰富协作历史之上。
Neo4j 研究是我们探索未来可能性的地方,既为了增强现有产品,也为了发现新机遇。作为多学科计算机科学家,我们与 Neo4j 的产品团队以及世界领先的研究机构合作,共同目标是加速图技术的发展。
项目
在 Neo4j,我们对图数据堆栈的所有部分进行系统研究。我们目前正在开展一系列多样化的项目,旨在解决时间图用例、无领导者事务处理方法以及基于动态编程语言的新型查询运行时。

我们的目标是了解如何为现代云环境构建图处理系统,使其比现有最先进的技术更强大,并脱离经典的(关系型)方法。
当前的图数据库运行时使用与关系型数据库相同的技术和原理构建,这可能会抑制它们的性能和功能。根本问题在于图运行时必须处理大量不规则性,这既源于模式可选性,也源于从机器角度来看工作负载和拓扑结构的不规则性。
为了解决这些问题,我们正在构建一个受动态编程语言技术启发的下一代查询运行时。它允许我们通过动态代码优化来优化无模式图,并通过采用新的计算范式(如分离式计算或专用硬件加速计算)来扩展处理。

现代图数据库管理系统(DBMS)允许用户将真实世界的交互建模为数十亿到万亿规模的节点和关系集合。然而,现有系统忽略了数据的时间维度:图如何随时间演变。由于缺乏原生时间支持,只能实现一些临时策略,这些策略的良好性能取决于有效图工作负载的大小,例如局部模式匹配或全局图算法。
为了解决这个问题,我们设计了 Aion,一个事务性时间图 DBMS,它概括了之前针对标签属性图(LPG)的方法。Aion 直接构建在 Neo4j 之上,并采用混合时间存储方法。对于点查找和小型子图查询,它使用 LineageStore,该存储按实体标识符索引图更新。对于需要任意时间点完全图重建的查询,它使用 TimeStore,该存储按时间索引更新。
为了实现增量图计算以提高延迟,Aion 引入了一种计算高效的内存中 LPG 表示。我们目前的实验表明,Aion 相对于现有的非事务性时间系统,吞吐量提高了7倍,并且比 Neo4j 提供了高达一个数量级的加速,同时存储开销极小。

事务协议历来与其支持的数据模型是解耦的。因此,图数据库要么支持两种次优选择之一:要么协议过于严格,牺牲性能以保持正确性;要么协议过于宽松,提供更好的性能但在正常操作中会损坏数据。
从长远来看,我们需要更好的选择。我们正在研究一种名为“多数人的合取”(Conjunction of Majorities)的方法,其中事务消息携带有关其前身(predecessors)的元数据。参与者使用此元数据与其本地状态进行比较,以确定兼容性。对于单分片事务,如果大多数参与者发现事务兼容,则可以通过传统的两阶段共识协议进行。对于多分片事务,每个分片都必须拥有多数,因此在一般情况下需要“多数人的合取”。
我们已经进行了理论研究,以确定该方法在正确性(特别是图的互易一致性)和全局约束方面的限制。我们还在构建一个原型系统,以评估该方法在实际条件下的性能。
出版物
Neo4j 拥有强大的出版历史,并经常与大学及其他工业研究人员合作。
2025
Text2Cypher:连接自然语言和图数据库
GenAIK 2025
Makbule Gulcin Ozsoy、Leila Messallem、Jon Besga 和 Gianandrea Minneci
2024
通过DBMS可扩展性实现硬件高效的数据插补
VLDB 2024
George Theodorakis 等
现代图数据库系统中变长记录B+树的实证评估
ICDEW 2024 (SEAGraph)
George Theodorakis, James Clarkson, 和 Jim Webber
Seraph:属性图流上的连续查询
EDBT 2024
Stefan Plantikow 和 Hannes Voigt 等
Aion:高效时间图数据管理
EDBT 2024
George Theodorakis, James Clarkson, 和 Jim Webber
BIFROST:未来图数据库运行时
ICDE 2024
George Theodorakis, James Clarkson, 和 Jim Webber
Seraph:属性图流处理实践
SIGMOD 2024
Stefan Plantikow、Hannes Voigt、Keith Hare 等
图分析路线图
SIGMOD 2024
Hannes Voigt 等
PG-Schema:属性图的Schema
ACM 数据管理ACM会议论文集
Stefan Plantikow、Hannes Voigt 等
VLDB 期刊:大数据图管理与处理特刊(社论)
大数据图管理与处理特刊
Hannes Voigt 等
2023
2022
分布式OLTP数据库中基于时代提交协议的性能研究
SRDS 2022
Jack Waudby、Jim Webber 等
Pick & Mix 隔离级别:混合序列化图测试
TPCTC 2022
Jack Waudby、Jim Webber 等
GQL 和 SQL/PGQ 中的图模式匹配
SIGMOD 2022
Hannes Voigt 等
2021
纯 Java 中的 GraphBLAS 实现
GRADES-NDA 2021
Florentin Dörre、Martin Junghanns 等
PG-Keys:属性图的键
SIGMOD 2021
Keith Hare 等
未来是大数据图!图处理系统社区观点
ACM 通讯 (第 64 卷,第 9 期)
Stefan Plantikow、Petra Selmer、Hannes Voigt 等
2020
建模最终一致性分布式图数据库的逐步降级
排队模型和服务管理
Jim Webber 等
2019
大数据图处理系统
Dagstuhl 研讨会 19491
Hannes Voigt 等
动态数据集的高效查询处理
SIGMOD 记录
Hannes Voigt 等
图数据库的模式验证和演进
概念建模。ER 2019
Peter Furniss、Alastair Green、Hannes Voigt 等
Period Index:一种用于范围和持续时间查询的2D学习哈希索引
SSTD 2019
Hannes Voigt 等
通过 Neo4j 中大型图的高效分析来理解巨魔
BTW 2019
David Allen、Amy Hodler、Michael Hunger、William Lyon、Mark Needham、Hannes Voigt 等
使用 Cypher 更新图数据库
VLDB 2019
Alastair Green、Tobias Lindaaker、Stefan Plantikow、Mats Rydberg、Petra Selmer、Andrés Taylor 等
属性图语言 Cypher 的近似查询
大数据 2019
Petra Selmer 等
2018
Cypher:一种不断发展的属性图查询语言
SIGMOD 2018
Alastair Green、Tobias Lindaaker、Stefan Plantikow、Mats Rydberg、Petra Selmer、Andrés Taylor 等
使用 GRADOOP 进行声明式和分布式图分析
VLDB 2018
Martin Junghanns、Max Kießling 等
openCypher:属性图查询的新方向
EDBT 2018
Peter Furniss、Alastair Green、Hannes Voigt 等
LDBC 社交网络基准业务智能工作负载初探
GRADES-NDA 2018
Alex Averbuch 等
2017
ACTiCLOUD:实现下一代云应用程序
ICDCS 2017
Jim Webber、Davide Grohmann 等
2016
图数据库路径索引研究
Euro-Par 2016:并行处理研讨会
Jonathan Sumrall、Johan Svensson、Magnus Vejlstrup、Chris Vest、Jim Webber 等
2015
LDBC 社交网络基准:交互式工作负载
SIGMOD 2015
Alex Averbuch 等
2012
Neo4j 程序化介绍
SPLASH (OOPSLA) 2012
Jim Webber
图遍历模式
图数据管理:技术与应用
Jim Webber
资金
Neo4j 建立在坚实的研究基础之上。研究是一项协作努力,我们与学术界的同行合作,共同推动图数据领域的边界。我们为各种活动提供研究资助,从硕士级别到项目和计划资助。
博士奖学金
基于我们与领先研究型大学的成功合作记录,Neo4j 能够为博士生提供有限数量的助学金,用于研究图数据库及相关领域。可用的助学金通过合作大学公布。
我们正在萨里大学(英国)联合指导的论文中招聘一名博士生,研究数据库内部的AI应用。此前,我们曾资助来自纽卡斯尔大学和伦敦大学伯克贝克学院的学生。
合作
Neo4j 当前和过去的研究合作示例如下。
正在进行的学术项目
纽卡斯尔大学 (英国)
Neo4j 与由Paul Ezhilchelvan 博士和Isi Mitrani 教授领导的团队合作,研究图数据库的新型事务协议。这项工作涉及为可伸缩、容错图数据库设计、建模、验证和实现新型事务处理协议。这项工作正在持续合作,团队中的博士生有机会在学习期间到 Neo4j 实习。
正在进行的学术项目
LIRIS (法国)
Neo4j 支持Angela Bonifati 教授及其团队在图查询语言方面正在进行的工作,包括 Neo4j 的 Cypher 和即将推出的 ISO GQL 标准。
多机构项目
ACTiCLOUD
一个由欧盟资助的H2020 研究项目,旨在为云端创建弹性基础设施,包括具有大容量聚合RAM和核心的服务器。作为这项工作的一部分,Neo4j 开展了研究,通过扩展 Cypher 运行时和查询规划器,以并行和 NUMA 感知的方式执行查询,从而利用底层平台提供的聚合资源。
即使在标准硬件上,这项研究的结果也意味着 Cypher 查询可以并行化,并且在查询计划中内置了局部性成本。自 Neo4j 5.13 版本以来,用户已经能够在数据库中高效地运行大型图分析作业,而这些作业以前一直是计算平台的领域,现在使用并行运行时,无需自定义代码。
多机构项目
LDBC
Neo4j 是Linked Data Benchmark Council (LDBC)的创始成员。LDBC 是一个独立的权威机构,负责指定基准、基准测试程序以及验证/发布用于管理互联数据软件系统的结果。自成立以来,其他数据库供应商也加入了这项工作,包括:Oracle、IBM、AWS 和 SAP。
联系我们
如果您想联系我们,请发送电子邮件至
research@neo4j.com