Data² 使用 Neo4j 构建领先的生成式AI分析平台

50%

reView 预计可解放的分析师工作量

20亿美元

Data² 团队历史管理预算

130亿美元

仅2024年能源领域AI市场规模

Data² 的使命是改变国防、情报和能源组织从结构化和非结构化数据中提取洞察的方式。

Data² 由一支军事退伍军人和能源行业专家团队创立,将领域专业知识与生成式AI相结合,助力分析师取得突破,从揭露隐藏的恐怖组织到理清和优化复杂的油井网络。

在该公司旗舰分析和人工智能推理平台 reView 的每一次部署背后,都是一个基于 Neo4j AuraDB 构建的 知识图谱

“当我们开始构建 reView 时,我们就知道需要采取不同的方法,”Data² 首席技术官 Jeff Dalgliesh 说道,“我在油田亲身看到,最有价值的信息存在于非结构化数据源中,例如钻井报告、设施记录和维护日志。”

Dalgliesh 发现关系型数据库难以分析这些大型数据集中的复杂关系。Data² 需要一种更具可扩展性的技术来为其新兴的分析平台提供动力——并且能够快速为生成式AI开发奠定基础。2023年,Indigo Advisory 估计,仅能源领域的AI市场价值就高达130亿美元,其中 生成式AI占AI总支出的28.1%

为什么关系型数据库和三元组存储不足

Data² 在其研发阶段探索了多种技术——但集成 Spark、三元组存储、Hadoop 集群和索引等组件对日益壮大的团队来说是一项艰巨的任务。这些技术需要专业知识和耗时的配置,从而减慢了开发速度。

“我们发现有了 Neo4j,我们无需担心幕后那些繁琐的事情,”Dalgliesh 解释说,“图技术帮助我们专注于构建AI能力,而不会陷入数据库管理和扩展的困境。”

Dalgliesh 还对集成 Neo4j 的 GraphRAG 能力感兴趣。GraphRAG 结合了知识图谱、数据科学、大语言模型 (LLM) 和 检索增强生成 (RAG),以提供更准确的用户查询响应。

“石油和天然气是一个由流程、人员和基础设施组成的互联网络,”Dalgliesh 说,“我们现在正在与一个客户合作,对盐水处理井进行建模。如果你转动一个阀门,导致管道中的流量减少,它会对处理井产生下游影响。基于 Neo4j 构建的知识图谱是对此类复杂网络中的关系进行建模的完美抽象层,比三元组存储更适合 reView。”

Dalgliesh 在 reView 的开发过程早期就排除了三元组存储。三元组存储是一种设计用于存储三元组的数据库,三元组是主语-谓语-宾语的组合,例如“Bob 35岁”或“Bob 认识 Fred”。“主语”的每个属性都必须建模为独立的三元组。随着三元组数量的增长,这种方法可能导致性能问题,使得高效查询和分析大型数据集变得困难。

“三元组存储更倾向于本体论的纯粹性,而非解决实际问题,”Dalgliesh 说,“它们是学术性的,僵化地坚持精确性。但当你试图快速理解一个混乱的领域时,你需要一个灵活的模型来帮助你快速解决业务问题。”

GraphRAG 为分析师提供了可追溯的证据链

如今,Data² reView 以存储在 Neo4j AuraDB 图数据库中的知识图谱形式呈现客户数据。Dalgliesh 的团队开发了多个组件,以提高 reView 的准确性并增强分析师的用户体验

  • Arctic Loader:Data² 构建此组件,用于将表格数据和文档加载到其知识图谱中,并将表格映射到图结构。
  • 问答系统:用户可以提问并获得准确的答案(存储回图谱中),该系统由 Neo4j GraphRAG 和 Anthropic 或其他LLM提供支持。
  • 证据图和问题图:Data² 为证据和问题维护独立的图谱,防止其语言模型摄入不正确的数据。

分析师现在能够查询包含数万个节点的数据集,并从生成式AI问答系统中获得通俗易懂的答案。用户可以深入查看支持每个答案的证据,并将结果作为训练数据接受,或标记为人为更正以提高模型的准确性。

“分析师需要能够精确剖析AI是如何得出特定结论或建议的,”首席业务官 Eric Costantini 表示,“Neo4j 使我们能够通过在子图级别应用访问控制来实施强大的信息安全。”

随着 reView 中用户问题的特异性和针对性增强,答案依然准确透明。

“你提出的问题越好,你就会变得越聪明,”Dalgliesh 解释说,“我们认为知识图谱是一个动态、不断演进的大脑,它捕捉了组织运营知识的全部范围。我们的生成式AI代理在这个大脑之上进行学习和推理,以提供基于数据的、与上下文相关的洞察和建议。”

利用“演进的大脑”为油气租赁收购发现更好的战略组合匹配和隐藏的安全威胁

将知识图谱和 GraphRAG 整合到 reView 中,Data² 得以在其客户数据中发现隐藏的模式。情报机构可以迅速锁定高价值调查目标,分析相关的生活模式数据,并识别隐藏的威胁网络。这种创新集成提供了对动态环境的全面理解,赋予决策者无与伦比的洞察力,以增强战略行动并维护国家安全。

石油和天然气高管可以使用 reView 在评估新的资产组合收购时做出更好的决策,从油田到钻井地点。reView 的AI产品简化了租赁评估任务,整合了关键的地质、生产和经济数据。这使得领导者能够以更大的信心做出更明智的选择。

运营数据难以获取。上图可视化了从油井建设和维护记录中提取的设备问题。这些证据通常埋藏在报告中,没有人有时间去查找或关联。Neo4j——结合 reView 的LLM驱动的事实提取器——使得时间资源有限的团队也能构建高度特定的领域知识图谱成为可能。

Data² 以生成式AI重新定义国防的愿景

2023年8月,美国国防部宣布成立一个生成式人工智能特别工作组,以评估和运用国防部内部的生成式AI能力。对于 Data² 团队及其客户而言,知识图谱仅仅是这个AI驱动未来的开始。

“Neo4j 让我们的用户能够轻松地与知识图谱交互和探索,并实现以往方法无法达成的任务成果,”Dalgliesh 解释说,“两个节点之间的距离可能包含着有助于让世界更安全答案。”

联系我们

对图驱动的解决方案能为您的业务带来哪些洞察感到好奇? 让我们聊聊 — 取得联系,我们会尽快回复您。

应用场景

  • 生成式AI

行业

  • 能源
  • 政府与市政
  • 美洲

探索更多