Neo4j 研究
欢迎来到 Neo4j 研究,我们将科学转化为技术。
在 Neo4j,我们构建令用户满意的图数据产品,并始终努力超越客户期望。我们的产品建立在计算机科学研究和扎实工程实践的丰富协作历史之上。
Neo4j 研究是我们探索未来可能性的地方,旨在增强现有产品并发现新机会。作为多学科的计算机科学家,我们与 Neo4j 的产品团队以及全球领先的研究机构合作,共同致力于加速图技术的发展。
当前项目
在 Neo4j,我们对图数据堆栈的各个部分进行系统研究。目前,我们正致力于一系列多元化的项目,涵盖时态图用例、无领导者事务处理方法以及基于动态编程语言的新型查询运行时。

我们的目标是了解如何为现代云环境构建比当前最先进技术更强大、且区别于传统(关系型)方法的图处理系统。
当前的图数据库运行时采用了与关系型数据库相同的技术和原理,这可能会限制其性能和功能。根本问题在于,从机器的角度来看,图运行时必须处理大量的非规则性(由模式的可选性以及工作负载和拓扑的非规则性引起)。
为了解决这些问题,我们正在构建一种受动态编程语言技术启发的下一代查询运行时。它使我们能够通过动态代码优化来优化无模式图,并通过采用新的计算范式(如存算分离或专用硬件加速计算)来扩展处理能力。
首席研究员:James Clarkson 博士
Aurendil 项目由英国科研与创新署 (UKRI) 部分资助。

图数据库在处理事务时不得不做出艰难的选择。它们要么选择牺牲性能的严格协议,要么选择过于宽松的协议,从而在正常(无故障)操作下冒数据损坏的风险。
我们在 RIOT(独立有序复制事务,Replicated Independently-Ordered Transactions)上的工作旨在为图数据库和其他类型的数据库同时提供可扩展性和 ACID 保证(高隔离级别)。在 RIOT 中,每个服务器都是领导者,因此取代了完全序列化操作的日志,我们采用了一个事务 DAG(有向无环图),以捕获并发性和依赖关系。RIOT 保证所有副本维护一个逻辑上相同的 DAG,在冲突需要时保持顺序,同时允许可交换操作并行执行。
RIOT 通过在协议消息中附加领先边缘(leading edges)(代表服务器最近 DAG 历史的元数据)来确保一致性。接收方根据自己的历史记录验证此元数据,以便在继续之前检测差异。这种广泛的交换允许参与者发布“合格投票”,将其对操作的批准建立在协调者了解其特定历史的前提之上。
我们已经证明 RIOT 即使在分片之间也能保持图的互惠一致性。即使在发生故障的情况下,它也能确保条目及其排序约束的原子达成一致。我们已经构建了一个原型系统,以评估该方法在现实条件下的性能。以该原型作为测试平台,我们目前正在研究优化恢复、降低网络利用率以及其他使 RIOT 成为许多系统实用基础层的主题。
首席研究员:Jim Webber 博士
RIOT 是与加州大学伯克利分校的联合研究项目。
过往项目
Neo4j 研究在近期有许多成功的项目历史,产生了有用的系统和显著的成果。您可以阅读更多关于我们的

我们的目标是了解如何为现代云环境构建比当前最先进技术更强大、且区别于传统(关系型)方法的图处理系统。
当前的图数据库运行时采用了与关系型数据库相同的技术和原理,这可能会限制其性能和功能。根本问题在于,从机器的角度来看,图运行时必须处理大量的非规则性(由模式的可选性以及工作负载和拓扑的非规则性引起)。
为了解决这些问题,我们正在构建一种受动态编程语言技术启发的下一代查询运行时。它使我们能够通过动态代码优化来优化无模式图,并通过采用新的计算范式(如存算分离或专用硬件加速计算)来扩展处理能力。

现代图数据库管理系统 (DBMS) 允许用户将现实世界的交互建模为数十亿到数万亿规模的节点和关系集合。然而,现有系统忽略了数据的时态维度:即图是如何随时间演变的。由于缺乏原生时态支持,系统往往实施即席策略,这些策略仅在取决于有效图工作负载大小(如局部模式匹配或全局图算法)时才能获得良好的性能。
为了解决这个问题,我们设计了 Aion,这是一个事务性时态图 DBMS,它归纳了之前针对标记属性图 (LPG) 的方法。Aion 直接构建在 Neo4j 之上,并采用混合时态存储方法。对于点查询和小子图查询,它使用 LineageStore,通过实体标识符索引图更新。对于需要根据任意时间点进行完整图重建的查询,它使用 TimeStore,通过时间索引更新。
为了实现增量图计算以降低延迟,Aion 引入了一种计算高效的内存中 LPG 表示。我们目前的实验表明,与现有的非事务性时态系统相比,Aion 的吞吐量提高了 7 倍,并且在存储开销最小的情况下,比 Neo4j 的速度提升了一个数量级。
出版物
Neo4j 拥有强大的出版历史,并经常与大学及其他工业界研究人员合作。
2025
多文件夹环形协议的消息全排序性能评估
MASCOTS 2025
Jim Webber 等人
TuskFlow:一种用于长时事务的高效图数据库
VLDB 2025
George Theodorakis, Hugo Firth, James Clarkson, Jim Webber 等人
基于环形顺序协议的吞吐量驱动数据库复制
IDEAS 2025
Jim Webber 等人
Text2Cypher:连接自然语言与图数据库
GenAIK 2025
Makbule Gulcin Ozsoy, Leila Messallem, Jon Besga, and Gianandrea Minneci
2024
通过 DBMS 可扩展性实现硬件高效的数据插补
VLDB 2024
George Theodorakis 等人
现代图数据库系统上变长记录 B+ 树的实证评估
ICDEW 2024 (SEAGraph)
George Theodorakis, James Clarkson, and Jim Webber
Seraph:属性图流上的连续查询
EDBT 2024
Stefan Plantikow and Hannes Voigt 等人
基于实现的数据库冲突解决无等待方法评估
EPEW 2024
Jim Webber 等人
Aion:高效的时态图数据管理
EDBT 2024
George Theodorakis, James Clarkson, and Jim Webber
BIFROST:未来的图数据库运行时
ICDE 2024
George Theodorakis, James Clarkson, and Jim Webber
使用 Seraph 进行属性图流处理
SIGMOD 2024
Stefan Plantikow, Hannes Voigt, Keith Hare, 等人
图分析路线图
SIGMOD 2024
Hannes Voigt 等人
图分析的未来(专家组会议)
SIGMOD 2024
Hannes Voigt 等人
PG-Schema:属性图的模式
ACM 数据管理汇编
Stefan Plantikow, Hannes Voigt, 等人
VLDB 期刊:大数据管理与处理特刊(编辑部)
大数据管理与处理特刊
Hannes Voigt, 等人
2023
2022
分布式 OLTP 数据库中基于周期提交协议的性能研究
SRDS 2022
Jack Waudby, Jim Webber 等人
混合隔离级别:混合序列化图测试
TPCTC 2022
Jack Waudby, Jim Webber 等人
GQL 和 SQL/PGQ 中的图模式匹配
SIGMOD 2022
Hannes Voigt 等人
2021
纯 Java 实现的 GraphBLAS
GRADES-NDA 2021
Florentin Dörre, Martin Junghanns 等人
PG-Keys:属性图的键
SIGMOD 2021
Keith Hare 等人
未来属于大数据图!社区对图处理系统的看法
ACM 通讯 (第 64 卷, 第 9 期)
Stefan Plantikow, Petra Selmer, Hannes Voigt 等人
2020
建模最终一致性分布式图数据库的渐进式降级
排队模型与服务管理
Jim Webber 等人
2019
大数据处理系统
达格斯图尔研讨会 19491
Hannes Voigt 等人
动态变化数据集的高效查询处理
SIGMOD 记录
Hannes Voigt 等人
图数据库的模式验证与演进
概念建模. ER 2019
Peter Furniss, Alastair Green, Hannes Voigt 等人
周期索引:一种用于范围和持续时间查询的学型 2D 哈希索引
SSTD 2019
Hannes Voigt 等人
在 Neo4j 中通过大数据高效分析了解网络水军
BTW 2019
David Allen, Amy Hodler, Michael Hunger, William Lyon, Mark Needham, Hannes Voigt 等人
使用 Cypher 更新图数据库
VLDB 2019
Alastair Green, Tobias Lindaaker, Stefan Plantikow, Mats Rydberg, Petra Selmer, Andrés Taylor 等人
属性图语言 Cypher 的近似查询
Big Data 2019
Petra Selmer 等人
2018
Cypher:一种用于属性图的不断发展的查询语言
SIGMOD 2018
Alastair Green, Tobias Lindaaker, Stefan Plantikow, Mats Rydberg, Petra Selmer, Andrés Taylor 等人
使用 GRADOOP 进行声明式和分布式图分析
VLDB 2018
Martin Junghanns, Max Kießling 等人
openCypher:属性图查询的新方向
EDBT 2018
Peter Furniss, Alastair Green, Hannes Voigt 等人
LDBC 社交网络基准商业智能工作负载的早期概览
GRADES-NDA 2018
Alex Averbuch 等人
2017
ACTiCLOUD:助力下一代云应用
ICDCS 2017
Jim Webber, Davide Grohmann 等人
2016
图数据库路径索引研究
Euro-Par 2016: 并行处理研讨会
Jonathan Sumrall, Johan Svensson, Magnus Vejlstrup, Chris Vest, Jim Webber 等人
2015
LDBC 社交网络基准:交互式工作负载
SIGMOD 2015
Alex Averbuch 等人
2012
Neo4j 编程入门
SPLASH (OOPSLA) 2012
Jim Webber
图遍历模式
图数据管理:技术与应用
Jim Webber
资助
Neo4j 建立在坚实的研究基础之上。研究是一项协作事业,我们与学术界的同事并肩工作,以推动图数据的边界。我们提供跨越一系列活动的科研资助,从硕士学位到项目和计划资助。
硕士学位论文
欢迎计算机科学或相关学科的硕士生联系我们,探讨论文级别项目机会。学生将获得我们研发团队的支持,为他们的论文构建和评估现实世界的数据库实现。
过去,Neo4j 曾接待过来自 埃因霍温理工大学 (TU Eindhoven), 瑞典皇家理工学院 (KTH), 莱比锡大学, 慕尼黑工业大学 (TU Munich), 隆德大学工程学院 (LTH) 的学生。
博士奖学金
基于我们与领先的研究密集型大学合作的成功记录,Neo4j 能够为博士生提供有限数量的助学金,用于调查图数据库及相关领域的研究兴趣领域。现有助学金将通过合作大学发布。
我们正在招聘一名与萨里大学 (英国) 联合指导论文的博士生,研究数据库内部的 AI 应用。此前,我们曾资助过来自 纽卡斯尔大学 和 伦敦大学伯贝克学院 的学生。
合作
以下是 Neo4j 当前和过去研究合作的示例。
正在进行的学术项目
纽卡斯尔大学 (英国)
Neo4j 正在与 Paul Ezhilchelvan 博士 和 Isi Mitrani 教授 领导的团队合作,致力于图数据库的新型事务协议。这项工作涉及为可扩展、容错的图数据库设计、建模、验证和实现新型事务处理协议。这是一项持续的合作,团队中的博士生有机会作为学习的一部分在 Neo4j 实习。
正在进行的学术项目
LIRIS (法国)
Neo4j 支持 Angela Bonifati 教授 及其团队在图查询语言方面正在进行的工作,包括 Neo4j 的 Cypher 和即将推出的 ISO GQL 标准。
跨机构项目
ACTiCLOUD
这是一项由欧盟资助的 H2020 研究项目,旨在为云创建弹性基础设施,包括具有大型聚合 RAM 和核心的服务器。作为该工作的一部分,Neo4j 进行了相关研究,通过扩展 Cypher 运行时和查询规划器,以并行和 NUMA 感知的方式执行查询,从而利用底层平台提供的聚合资源。
即使在标准硬件上,这项研究的结果也意味着 Cypher 查询可以并行化,并将局部性成本构建到其查询计划中。自 Neo4j 5.13 起,用户已能够使用并行运行时在数据库中高效运行大型图分析作业,而无需自定义代码,这些作业以前通常属于计算平台的领域。
跨机构项目
LDBC
Neo4j 是 链接数据基准委员会 (LDBC) 的创始成员。LDBC 是一个独立的权威机构,负责为旨在管理关联数据的软件系统指定基准、基准测试程序并验证/发布结果。自成立以来,其他数据库供应商也加入了这一努力,包括:Oracle、IBM、AWS 和 SAP。
联系我们
如果您想与我们联系,请发送电子邮件至
research@neo4j.com