Neo4j 发布首个企业级图机器学习解决方案
图机器学习此前一直属于科技巨头专属领域,现已在 Neo4j Graph Data Science 库的 1.4 版本中推出
加利福尼亚州圣马特奥,2020年10月20日 – Neo4j®,图技术领域的领导者,宣布推出新版本的 Neo4j 图数据科学™ 库 (Neo4j for Graph Data Science),这是一项前沿创新,通过利用深度学习和图卷积神经网络,普及了基于图的先进机器学习技术。
在此之前,除了 Google 和 Facebook 等少数几家科技巨头之外,很少有公司有能力在人工智能方面利用图嵌入 (graph embeddings)。这项强大且创新的技术计算图上每个节点周围的网络结构,从而实现更强大的机器学习预测。Neo4j Graph Data Science 库的 1.4 版本普及了这些创新,并彻底改变了企业进行预测的方式,特别是在欺诈检测、客户或患者旅程跟踪、药物发现或知识图谱创建等领域。

图例:图嵌入是抽象复杂图结构并降低维度的强大工具。这项技术为图机器学习的应用开辟了许多可能性。
Neo4j Graph Data Science 库的 1.4 版本提供了首个企业级图机器学习功能。从数据中学习广义和预测性特征的能力至关重要,因为企业并不总是知道如何表示连接的数据以便在机器学习模型中使用。最新版本的 Neo4j 包含图嵌入算法,这些算法从图的结构中学习,而不是依赖预定的公式来计算特定的特征,例如中心性得分。
Neo4j 产品负责人兼数据科学家 Alicia Frame 解释了使用 Neo4j Graph Data Science 库 1.4 版本对分析团队的意义。
“我们很高兴能在易于使用的企业软件中提供前沿的图嵌入技术,”Frame 博士说道。“最新版本的 Neo4j Graph Data Science 库普及了这些前沿技术,使每个人都能使用基于图的机器学习。这真正革新了预测分析。”
GOV.UK 上的图嵌入
在 GOV.UK 博客上,一篇题为《One Graph to rule them all》的近期文章中,数据科学家 Felisia Loukou 和 Matthew Gregory 博士回顾了他们首次使用图数据科学和 Neo4j 知识图谱部署机器学习模型的经历。他们的模型根据 GOV.UK 用户当前正在查看的页面自动推荐内容。在他们2020年8月的文章中,他们解释道:
“无论图是什么,node2vec 都能从节点的向量特征中学习,这些特征随后可用于各种机器学习任务,例如内容推荐。在此过程中,为训练和部署模型所需的数据基础设施的创建是最耗时的部分。”
主要功能
借助 Neo4j Graph Data Science 库,企业现在有了从现有数据中学习、获取更多价值并持续提高预测准确性的新方法:
-
揭示隐藏的洞见:图嵌入算法能够学习数据中具有结构意义的内容,并创建一个通常由传统图算法收集的超集信息。为此,图嵌入会采样图的拓扑和属性,然后降低复杂性,只保留与深度学习最相关的特征。
-
突破传统算法的局限:图算法和图嵌入能够从图的拓扑结构和属性中抽象出其结构,从而能够基于数据节点之间的关系进行结果预测,而不仅仅是基于原始数据本身。
-
通过泛化学习加速数据上的特征计算,当预测因子不明确时,可以避免测试多个针对性算法,特别是使用FastRP等高性能方法时。
-
整合新数据和预测:将 GraphSAGE 学习到的函数存储在新的流式机器学习模型目录中,然后将其应用于新数据,以获得更多的图嵌入和预测,而无需重新训练模型。
-
通过持续添加评分和分类结果以及预测缺失信息,不断增强图数据库的价值,持续改进洞察力。
Neo4j Graph Data Science 库的 1.4 版本包含三种新的图嵌入选项,这些选项从图的拓扑结构中学习并计算更精确的表示:
-
node2Vec,一种知名的图嵌入算法,使用神经网络,
-
FastRP,一种比 node2vec 快 75,000 倍的图嵌入方法,即使对于大型图也能提供等效的精度,
-
GraphSAGE,一种使用卷积神经网络进行图表示学习的图嵌入过程和算法。随着图的更新,它可以持续应用。
除了提供复杂向量表示的图嵌入方法之外,新版本的 Neo4j Graph Data Science 库还添加了机器学习算法,例如k-NN (最近邻)算法,该算法常用于模型分类,以帮助理解图嵌入。
知识图谱创建示例

图例:此图显示了知识图谱的创建流程。Neo4j Graph Data Science 库的 1.4 版本现在支持在基于图的机器学习任务中创建端到端流程,例如知识图谱的创建。
在药物发现场景中,这意味着可以识别基因与疾病之间或药物与蛋白质之间的新关联,并提供即时上下文以评估这些发现的相关性或有效性。在客户推荐方面,从用户旅程中汲取经验,以便在未来的购买中提供精准推荐,同时呈现他们的购买历史选项,以增加他们对建议的信任度。
了解更多
详细了解 Neo4j 图数据科学或在此处下载最新版本。 1.4 版本将在 Neo4j 全球开发者大会NODES上发布。您也可以回放观看活动 Neo4j Connections for Graph Data Science 的演示文稿和演示。
资源
关于 Neo4j
Neo4j 是图数据库技术领域的领导者。拥有全球最多的部署案例,Neo4j 助力全球企业——例如 Airbus、Michelin、NASA、Crédit Agricole 和Volvo Cars——预测和识别人员、流程、地点和系统如何相互关联。通过这种基于关系的方 法,使用 Neo4j 开发的应用程序解决了与连接数据相关的挑战,例如分析和人工智能、欺诈检测、实时推荐和知识图谱。要了解更多信息,请访问Neo4j.com 和@Neo4jFr。
媒体联系人
BS Conseil & Communication
Bruno Sanvoisin
电话:06 82 52 62 39
邮箱:bruno@bs-communication.com