知识库

通俗易懂的图分析

总的来说,图在提供需要考虑关系的答案方面非常强大。在这种情况下,使用图查询(Cypher)使我们能够在知道要查找什么时回答特定问题,例如

  • 通过使用交易数据查找欺诈者以及受害者,

  • 然后进一步扩展这种关系到相关的产品目录以提出建议,

  • 并从中将其与流程集成以形成其数字孪生以及供应链信息。

因此,通过定义上述领域之间的关系,我们可以为客户360、欺诈检测、产品推荐、数字孪生、供应链等用例增加巨大的价值。

也就是说,除了特定的指向性查询之外,如果我们想深入了解这些数据以回答诸如查找社区或一般重要内容等一般性问题呢?

那么对于此类用例,图数据科学库 (GDS) 就派上用场了,因为它提供了许多有用的算法,使我们能够及时地完成复杂的操作。

无监督算法

例如,如果您想了解什么是重要的?好吧,GDS 拥有超过 50 多种(无监督学习)算法,可以为您提供以下各种示例查询的答案

  • 哪些节点最重要?

  • 哪些节点聚集在一起?

  • 哪些节点最相似?

  • 哪些节点最不寻常?

或者

  • 集群在哪里?

  • 我的图的哪些部分彼此连接更紧密?

  • 哪些部分可能被连接?

  • 哪些模式是常见的?

  • 使用嵌入查找关联和低维表示。

一般来说,无监督 GDS 算法允许我们找到诸如以下模式:

  • 中心性计算 - 查找网络中对图至关重要且中心的物体,

  • 相似性算法 - 物体之间的相似性(基于属性和连接)

  • 路径查找算法 - 到某个东西的最短路径

  • 社区检测算法 - 有哪些社区

  • 启发式链接预测 - 基于规则集预测关系

监督算法和机器学习

通常,您希望利用图数据根据过去的数据对未来进行预测,例如标签(即潜在的欺诈者)或推荐(即流失)。

在这种情况下,您可以使用图嵌入创建图的数值/表格表示,将其馈送到机器学习模型以使这些任务更容易,但更重要的是,我们可以进一步利用特征提取算法来进一步丰富训练数据(以及模型)以持续提高我们预测的准确性。

归根结底,来自数据库内图数据的嵌入式训练数据具有以下优势:数据无需从外部来源移动,并且此类任务可以更快、更容易地完成。