Neo4j 宣布首个专为企业打造的图学习解决方案


图学习以前只属于科技巨头,现在 Neo4j 的图数据科学库 1.4 版已推出,让图学习触手可及。

加利福尼亚州圣马特奥,2020 年 10 月 20 日 Neo4j®,图技术领域的领导者,宣布推出 Neo4j 图数据科学™ 库的新版本,这是一项尖端创新,它通过利用深度学习和图卷积神经网络,将先进的基于图的机器学习技术普及化。

到目前为止,除了谷歌和 Facebook 之外,很少有企业能够在人工智能方面利用图嵌入。这种强大的创新技术计算了围绕图中每个节点的网络形状,从而能够实现更出色的机器学习预测。Neo4j 图数据科学库 1.4 版使这些创新民主化,彻底改变了企业进行预测的方式,尤其是在欺诈检测、客户或患者旅程跟踪、药物开发或知识图创建方面。

La vectorisation des graphes est un outil puissant pour abstraire les structures de graphes complexes et réduire leur dimension.

说明:图嵌入是一种强大的工具,可以抽象复杂的图结构并降低其维度。这种技术为使用基于图的机器学习开辟了许多可能性。

Neo4j 图数据科学库 1.4 版提供首个针对企业的图机器学习功能。从数据中学习泛化和预测性特征的能力至关重要,因为企业并不总是知道如何表示连接数据以便将其用于机器学习模型。Neo4j 的最新版本包括图向量化算法,这些算法从图结构中学习,而不是依赖预定义公式来计算特定特征,例如中心性评分。

Neo4j 的产品经理兼数据科学家 Alicia Frame 解释了将 Neo4j 图数据科学库 1.4 版用于分析团队的好处。

“我们很高兴在易于使用的企业软件中提供最先进的图向量化技术。”Frame 博士说。“Neo4j 图数据科学库的最新版本使这些尖端技术民主化,并使每个人都可以使用基于图的机器学习。这真正彻底改变了预测分析。”

在 GOV.UK 上进行图向量化

在 GOV.UK 博客上,最近的一篇名为“一图统领全局”的文章中,数据科学家Felisia LoukouMatthew Gregory 博士 回顾了他们首次使用图数据科学和 Neo4j 知识图构建机器学习模型的部署情况。他们的模型根据用户正在查看的页面自动向 GOV.UK 用户推荐内容。在他们 2020 年 8 月的文章中,他们解释说:“

“无论图是什么,node2vec 都可以从节点的向量特征中学习,这些特征随后可用于各种机器学习任务,例如内容推荐。在此过程中,创建用于训练和部署模型的必要数据基础设施是最耗时的部分。”

主要功能

借助 Neo4j 图数据科学库,企业现在拥有了一种从现有数据中学习、从中获取更多价值并持续提高预测准确性的新方法:

  • 揭示意想不到的信息:图向量化算法可以学习数据中结构上的意义,并创建通常由传统图算法收集的信息的超集。为此,图向量化对图的拓扑结构和属性进行采样,然后简化其复杂性,以仅保留与深入机器学习最相关的特征。

  • 消除传统算法遇到瓶颈时的停滞现象。图算法和向量化能够从其拓扑结构和属性中抽象出图的结构,从而可以根据数据节点之间的关系来预测结果,而不是仅从原始数据中预测结果。

  • 通过泛化学习加速对数据的特征计算,从而避免在预测因子不明确的情况下测试多个目标算法,特别是使用FastRP 等高性能方法。

  • 通过将 GraphSAGE 学习到的功能存储在新机器学习模型持续目录中,然后将这些功能应用于新数据以生成更多向量化和预测,而无需重新训练模型,从而整合新数据和预测。

  • 通过持续添加评分和分类结果,以及预测缺失信息来提高洞察力,从而提高图数据库的价值。

Neo4j 图数据科学库 1.4 版包含三个新的图向量化选项,这些选项可以从图的拓扑结构中学习并计算更准确的表示形式

  • node2Vec,一种使用神经网络的知名图向量化算法,

  • FastRP,一种比 node2vec 快 75,000 倍的图向量化方法,它提供了等效的准确性,包括对于大型图。

  • GraphSAGE,一种使用卷积神经网络的图向量化和图表示学习算法。它可以在图更新时持续应用。

除了提供复杂向量表示的图向量化之外,Neo4j 图数据科学库的新版本还添加了机器学习算法,例如k-NN(最近邻) 算法,该算法通常用于模型分类,以更轻松地理解图向量化。

创建知识图的示例

Cette image montre le flux de création d’un graphe de connaissances.

图例:此图像显示了创建知识图的工作流程。Neo4j 图数据科学库 1.4 版现在允许在基于图的机器学习任务(例如创建知识图)中创建端到端工作流程。

在药物开发场景中,这意味着可以识别基因与疾病或药物与蛋白质之间的新关联,还可以提供即时上下文以评估这些发现的相关性或有效性。在客户推荐方面,从用户旅程中吸取教训,以预测未来购买时的准确推荐,同时还提供用户购买历史记录选项,使他们更相信建议。

了解更多信息

详细了解 Neo4j 图数据科学或下载最新版本。1.4 版将在 Neo4j 全球开发者大会NODES 上发布。您也可以观看演示文稿和演示,该演示文稿来自Neo4j 图数据科学连接 活动。

资源

关于 Neo4j

Neo4j 是图数据库技术的领导者。Neo4j 在全球拥有最多的部署,它帮助全球企业(如空中客车、米其林NASA农业信贷银行沃尔沃汽车)预测和识别人员、流程、地点和系统之间的相互联系方式。通过这种关系方法,使用 Neo4j 开发的应用程序可以解决与连接数据相关的挑战,例如分析和人工智能欺诈检测实时推荐知识图。要了解更多信息,请访问 Neo4j.com @Neo4jFr

媒体联络
BS 咨询与传播
Bruno Sanvoisin
电话:06 82 52 62 39
邮件:bruno@bs-communication.com