Data² 使用 Neo4j 构建领先的 GenAI 分析平台
从揭露恐怖组织到理清和优化复杂的油井网络,Data² reView 使分析师能够充满信心地做出高风险决策。
Data² 的使命是改变国防、情报和能源组织从结构化和非结构化数据中提取见解的方式。
Data² 由一支由军事退伍军人和能源行业专家组成的团队创立,将领域专业知识和生成式 AI 结合在一起,使分析师能够取得突破,从揭露隐藏的恐怖组织到理清和优化复杂的油井网络。
在公司旗舰分析和人工推理平台 reView 的每次部署背后,都是一个基于 Neo4j AuraDB 构建的 知识图谱。
“当我们着手构建 reView 时,我们知道我们需要采取一种不同的方法,”Data² 首席技术官 Jeff Dalgliesh 说。“我在油田亲眼目睹了最宝贵的信息存在于非结构化来源中,例如钻井报告、设施记录和维护日志。”
Dalgliesh 发现关系数据库难以分析这些大型数据集中的复杂关系。Data² 需要更可扩展的技术来为其新兴的分析平台提供动力,并且这种技术能够快速为生成式 AI 开发奠定基础。在 2023 年,Indigo Advisory 估计,仅能源行业的人工智能市场价值高达 130 亿美元,而 GenAI 占整体人工智能支出的 28.1%。
为什么关系数据库和三元组存储不足
Data² 在其研发阶段探索了许多技术,但集成 Spark、三元组存储、Hadoop 集群和索引等组件对于不断壮大的团队来说是一项艰巨的任务。这些技术需要专业知识和耗时的配置,从而减缓了开发速度。
“我们发现,使用 Neo4j,我们无需担心幕后所有混乱,”Dalgliesh 解释说。“图技术帮助我们专注于构建人工智能功能,而无需陷入数据库管理和扩展的泥潭。”

Neo4j 知识图谱在互联的网络中可视化节点和关系。
Dalgliesh 还对集成 Neo4j 的 GraphRAG 功能感兴趣。GraphRAG 结合了知识图谱、数据科学、大型语言模型 (LLM) 和 检索增强生成 (RAG),为用户查询提供更准确的响应。
“石油和天然气是一个相互关联的流程、人员和基础设施网络,”Dalgliesh 说。“我们目前正在与一个客户合作,对盐水处置井进行建模。如果关闭一个阀门,减少管道中的流量,就会对处置井产生下游影响。基于 Neo4j 构建的知识图谱是用于对这种复杂网络中的关系进行建模的完美抽象层,并且比三元组存储更适合 reView。”
在 reView 的开发初期,Dalgliesh 就排除了使用 三元组存储。三元组存储是一种数据库类型,专门用于存储三元组,三元组由主体-谓词-宾语构成,例如“Bob 年龄 35 岁”或“Bob 认识 Fred”。“主体”的每个属性都必须建模为单独的三元组。这种方法会导致随着三元组数量的增加而出现性能问题,使得高效查询和分析大型数据集变得困难。
“三元组存储更注重本体论的纯净性,而不是解决现实世界的问题,”Dalgliesh 说。“它们是学术性的,对精确性有严格的要求。但是,当你试图快速理解一个混乱的领域时,你需要一个灵活的模型来帮助你快速解决业务问题。”
GraphRAG 为分析师提供可跟踪的证据
如今,Data² reView 使用存储在 Neo4j AuraDB 图数据库中的知识图谱来呈现客户数据。Dalgliesh 的团队开发了几个组件,以提高 reView 的准确性并增强分析师的用户体验
-
- Arctic Loader:Data² 构建了这个组件来将表格数据和文档加载到他们的知识图谱中,并将表格映射到图结构。
- 问答系统:用户可以提出问题并获得准确的答案(存储回图谱中),由 Neo4j GraphRAG 和 Anthropic 或其他 LLM 提供支持。
- 证据图和问题图:Data² 为证据和问题维护单独的图谱,防止其语言模型摄取不正确的数据。


reView 的问答系统,由 Neo4j GraphRAG 提供支持。
分析师现在能够对拥有数万个节点的数据集进行提问,并从 GenAI 问答系统中获得用普通英语表达的答案。用户可以深入研究支持每个答案的证据,并接受结果作为训练数据或将其标记为需要人工更正,以提高模型的准确性。
“分析师需要能够准确地剖析 AI 如何得出某个结论或建议,”首席商务官 Eric Costantini 说。“Neo4j 使我们能够通过在子图级别应用访问控制来实施强大的信息安全。”
随着 reView 中用户问题的越来越具体和针对性,答案仍然准确透明。
“你问的问题越好,你就会变得越聪明,”Dalgliesh 解释道。“我们将知识图谱视为一个动态的、不断进化的“大脑”,它捕获了组织运营知识的全部范围。我们的生成式 AI 代理在“大脑”的基础上学习和推理,以提供与上下文相关的洞察力和基于数据的建议。”
使用“不断进化的“大脑”发现更适合 O&G 租赁收购和隐藏安全威胁的战略投资组合
将知识图谱和 GraphRAG 整合到 reView 中使 Data² 能够在其客户数据中发现隐藏的模式。情报机构可以快速锁定高价值的调查目标,分析相关的活动模式数据,并识别隐藏的威胁网络。这种创新的整合提供了对动态环境的全面了解,为决策者提供无与伦比的洞察力,以增强战略行动并维护国家安全。

Data² 将人类情报与金融情报相结合,以揭示隐藏的行动者网络。
石油和天然气高管可以使用 reView 在评估新的投资组合收购(从油田到钻井地点)时做出更明智的决策。reView 的 AI 产品简化了评估租赁的任务,整合了关键的地质、生产和经济数据。这使领导者能够更加自信地做出更明智的选择。

从油井的施工和维护记录中提取的设备运行问题的可视化,是 Data² 用于评估油井价值和性能的模型的一部分。
运营数据难以获取。上图可视化了从油井的施工和维护记录中提取的设备问题。这些证据通常隐藏在没有人有时间去查找或连接的报告中。Neo4j 与 reView 的 LLM 驱动的事实提取器相结合,使团队能够在时间和资源有限的情况下构建高度特定的领域知识图谱。
Data² 对使用生成式 AI 重塑国防的愿景
Data² 首席技术官 Jeff Dalgliesh 展示了 reView 的功能。
2023 年 8 月,美国国防部宣布成立一个生成式人工智能工作组,评估并在整个国防部范围内使用 GenAI 功能。对于 Data² 团队及其客户来说,知识图谱只是这个 AI 驱动未来的开始。
“Neo4j 使我们的用户能够轻松地与知识图谱交互并探索知识图谱,并实现以前的方法无法实现的任务成果,”Dalgliesh 解释道。“两个节点之间的距离可能包含一个答案,帮助使世界更安全。”
联系我们
您想知道如何使用图驱动解决方案为您的业务解锁洞察力吗?让我们谈谈 - 联系我们,我们会与您联系。