增强数据信任与透明度:利用 IBM Manta 数据血缘和 Neo4j 实现治理和迁移

金融机构需要能够信任其数据并有效地使用它。这包括能够

  • 优化和现代化数据在其组织中的流动方式
  • 更快、更低成本地交付数据和云迁移项目
  • 遵守围绕数据治理和隐私的监管要求

为了有效地治理和分析数据,企业必须了解数据如何在各种系统(包括云数据库、运营系统、数据仓库和主机源)中流动和转换。随着企业将其工作流程中集成 AI 以及数据变得更加复杂,数据质量和可解释性变得更加关键。

IBM Manta 数据血缘 是一个世界一流的数据血缘平台。它通过自动扫描代码、自定义 SQL、ETL 作业和商业智能报表来帮助客户解答此类问题。然后,它在交互式彩色编码地图中显示数据流,从而展示端到端血缘关系。

Manta 平台的第一代构建在关系数据库管理系统 (RDBMS) 上——很快便展现了该技术的局限性。这是因为关系数据库并非为处理连接数据而构建或优化。该系统难以处理查看对象如何关联在一起以跟踪其数据流所需的基于关系的查询。

图技术可以提供 Manta 所需的性能、灵活性和敏捷性,但使用开源 Titan 图数据库的初步尝试未能跟上不断增长的需求。客户需要一个能够处理其不断变化的数据环境的完整范围和复杂性的血缘关系合作伙伴。

Manta 进行了一个为期六个月的概念验证,涉及多个商业图数据库供应商,最终选择 Neo4j,因为它具有出色的性能、成熟度和响应迅速的支持团队。

多跳图查询提供更快、更深入的数据理解

Neo4j 属性图数据模型为多跳查询提供了高性能,将单个问题划分为跨多个文档和源的多个子问题。这消除了关系数据库所需的缓慢且昂贵的联接操作。公司现在可以实时解决血缘关系问题,增强平台的整体可见性。

除了显示当前时刻的数据和关系的图形数据血缘关系图之外,IBM Manta 数据血缘还允许用户执行内省查询以了解过去数据发生了哪些变化。例如,客户可以查看本季度的 Tableau 报表的血缘关系,查看其财政年度开始时的血缘关系,或查看任何其他时间点。如果没有 Neo4j,这些查询的运行时间将长得多。

Neo4j 图数据库为关键数据血缘用例提供支持

合规与治理

金融行业和数据隐私合规标准(例如 巴塞尔协议 IIBCBS 239GDPR)对数据治理和管理提出了严格的要求,包括能够展示数据血缘关系。Neo4j 图数据库帮助企业履行这种保管职责并为审计人员提供证据,例如个人数据存储在哪里以及如何在组织中移动。

DataOps

DataOps 团队必须确保数据管道顺畅流动,以维护数据驱动的业务。例如,在数据库管理员对 Microsoft SQL Server 系统进行更改之前,他们首先需要确保不会中断分析师依赖的下游 Power BI 报表。借助图技术,DataOps 专业人员可以快速向前和向后跟踪血缘关系,从而简化调试并提高应用程序的可靠性和维护性。

云迁移

对数据血缘关系的清晰可见性帮助企业做出有关云迁移的准确决策。数据血缘关系帮助客户确定哪些工具和系统仍在积极使用,以便他们可以减少对不需要的环境的许可证,优化迁移并加快云投资回报率。

A data lineage query highlights the downstream impact of a field edit in red.
上图:数据血缘关系查询以红色突出显示字段编辑的下游影响。

 

行业领先的图技术推动竞争优势

Neo4j 对 Manta 业务的影响是巨大的

  • 企业级性能。Neo4j 满足 IBM Manta 数据血缘关系的大规模银行、保险、制造和政府客户对性能和可靠性的巨大期望,这些客户之间存在数千万个资产之间的关系。
  • 快速创新。从广泛的 API 支持到 100% Java 开发,Manta 工程团队发现 Neo4j 比其他解决方案更容易编码。因此,Manta 可以快速在其平台上添加新技术、功能和增强功能。
  • 面向未来的业务。Neo4j 能够通过分片等技术进行扩展是 IBM 选择 Neo4j 的关键因素。

随着生成式 AI 和大型语言模型 (LLM) 改变业务,Manta 看到了数据血缘关系的令人兴奋的新用例。

联系我们

想知道您可以使用图驱动的解决方案为您的业务解锁哪些见解?让我们聊聊 - 联系我们,我们会与您联系。