Data² 使用 Neo4j 构建领先的生成式AI分析平台

50%

reView 预计可解放分析师的工作量

20亿美元

Data² 团队历史管理预算

130亿美元

2024年仅能源领域的AI市场规模

Data² 的使命是改变国防、情报和能源组织从结构化和非结构化数据中提取洞察的方式。

由军事退伍军人和能源行业专家团队创立,Data² 将领域专业知识和生成式AI结合起来,使分析师能够取得突破,从发现隐藏的恐怖组织到理清并优化复杂的油井网络。

公司旗舰分析和人工智能推理平台 reView 的每一次部署背后,都有一个基于 Neo4j AuraDB 构建的知识图谱

Data² 首席技术官 Jeff Dalgliesh 表示:“我们知道在构建 reView 时需要采取不同的方法。我亲身在油田看到了最有价值的信息存在于非结构化来源中,例如钻井报告、设施记录和维护日志。”

Dalgliesh 发现关系型数据库难以分析这些大型数据集中的复杂关系。Data² 需要一种更具可扩展性的技术来为其新兴的分析平台提供支持,并且能够快速为生成式AI开发奠定基础。2023年,Indigo Advisory 估计,仅能源领域的AI市场价值就高达130亿美元,其中 生成式AI 占AI总支出的28.1%

为何关系型数据库和三元组存储不足

Data² 在研发阶段探索了多种技术——但集成 Spark、三元组存储、Hadoop 集群和索引等组件对日益壮大的团队来说是一项艰巨的任务。这些技术需要专业知识和耗时的配置,从而减缓了开发速度。

Dalgliesh 解释说:“我们发现有了 Neo4j,我们无需担心所有那些幕后的麻烦。图技术帮助我们专注于构建AI能力,而不会被数据库管理和扩展所困扰。”

Dalgliesh 还对集成 Neo4j 的 GraphRAG 能力感兴趣。GraphRAG 结合了知识图谱、数据科学、大型语言模型 (LLM) 和检索增强生成 (RAG),以提供更准确的用户查询响应。

Dalgliesh 说:“石油和天然气是一个由流程、人员和基础设施组成的互联网络。我们目前正在与一个客户合作,对盐水处置井进行建模。如果关闭一个阀门导致管道流量减少,就会对处置井产生下游效应。基于 Neo4j 构建的知识图谱是建模此类复杂网络中关系的完美抽象层,比三元组存储更适合 reView。”

Dalgliesh 在 reView 的早期开发过程中就排除了三元组存储。三元组存储是一种旨在存储三元组的数据库,三元组是主语-谓语-宾语的组合,例如“Bob 35岁”或“Bob 认识 Fred”。“主语”的每个属性都必须作为其自身的三元组进行建模。这种方法可能导致性能问题,因为三元组数量的增长,使得高效查询和分析大型数据集变得困难。

Dalgliesh 说:“三元组存储更倾向于本体论的纯粹性,而不是解决现实世界的问题。它们是学术性的,对精确性有严格的坚持。但当你试图快速理解一个混乱的领域时,你需要一个灵活的模型,帮助你快速解决业务问题。”

GraphRAG 为分析师提供可追溯的证据链

如今,Data² reView 通过存储在 Neo4j AuraDB 图数据库中的知识图谱呈现客户数据。Dalgliesh 的团队开发了几个组件,提高了 reView 的准确性并增强了分析师的用户体验。

  • Arctic Loader:Data² 构建此组件,用于将表格数据和文档加载到其知识图谱中,并将表格映射到图结构。
  • 问答系统:用户可以提问并获得准确的答案(存储回图中),由 Neo4j GraphRAG 和 Anthropic 或其他 LLM 提供支持。
  • 证据图和问题图:Data² 维护独立的证据图和问题图,防止其语言模型摄入不正确的数据。

分析师现在能够查询拥有数万个节点的数据集,并以通俗易懂的英语从生成式AI问答系统中获得答案。用户可以深入了解支持每个答案的证据,并接受结果作为训练数据,或将其标记以便人工纠正以提高模型的准确性。

首席商务官 Eric Costantini 表示:“分析师需要能够精确剖析AI是如何得出特定结论或建议的。Neo4j 使我们能够通过在子图级别应用访问控制来实施强大的信息安全。”

随着 reView 中用户问题的特异性和针对性增强,答案仍保持准确和透明。

Dalgliesh 解释说:“你提出的问题越好,你就会变得越聪明。我们认为知识图谱是一个动态的、不断演变的‘大脑’,它捕捉了一个组织运营知识的完整范围。我们的生成式AI代理在这个‘大脑’之上学习和推理,以提供与上下文相关的、基于数据的洞察和建议。”

用“不断演进的大脑”发现更适合油气租赁收购的战略投资组合和隐藏的安全威胁

将知识图谱和 GraphRAG 整合到 reView 中,使得 Data² 能够发现客户数据中隐藏的模式。情报机构可以迅速锁定高价值的调查目标,分析相关的生活模式数据,并识别隐藏的威胁网络。这种创新集成提供了对动态环境的全面理解,赋能决策者以无与伦比的洞察力,从而提升战略运营并维护国家安全。

油气高管可以使用 reView 在评估新的投资组合收购(从油田到钻井地点)时做出更好的决策。reView 的 AI 产品简化了评估租赁的任务,整合了关键的地质、生产和经济数据。这使得领导者能够更明智、更自信地做出选择。

操作数据难以获取。上图展示了从油井建设和维护记录中提取的设备问题。这些证据通常埋藏在报告中,没有人有时间去查找或关联。Neo4j——结合 reView 的 LLM 驱动的事实提取器——使得时间资源有限的团队也能够构建高度专业的领域知识图谱。

Data² 借生成式AI重塑国防的愿景

2023年8月,美国国防部宣布成立生成式人工智能工作组,以评估和运用生成式AI能力于国防部各个领域。对于 Data² 团队及其客户而言,知识图谱只是这个AI驱动未来的开端。

Dalgliesh 解释说:“Neo4j 使我们的用户能够轻松地与知识图谱互动和探索,并实现以往方法无法达成的任务成果。两个节点之间的距离可能蕴藏着让世界更安全答案。”

联系我们

好奇图驱动的解决方案能为您的业务带来哪些洞察?联系我们,我们将尽快与您取得联系。

用例

  • 生成式AI

行业

  • 能源
  • 政府与市政
  • 美洲

探索更多