Neo4j 宣布推出首款企业级图机器学习


迄今为止仅限于大型科技公司使用的图原生机器学习现已通过 Neo4j 图数据科学 1.4 版提供


**加利福尼亚州圣马特奥 - 2020 年 10 月 20 日** - Neo4j®,图技术的领导者,宣布推出最新版本的Neo4j 图数据科学™,这是一项突破性技术,它通过利用深度学习和图卷积神经网络,使先进的基于图的机器学习 (ML) 技术民主化。

迄今为止,除了谷歌和 Facebook 之外,很少有公司拥有 AI 前瞻性和资源来利用图嵌入。这种强大而创新的技术计算图中每个数据片段周围网络的形状,从而能够进行更好的机器学习预测。Neo4j 图数据科学 1.4 版使这些创新民主化,从而彻底改变企业在各种场景中进行预测的方式,从欺诈检测到跟踪客户或患者旅程,再到药物发现和知识图谱补全。

Graph embeddings are a powerful tool to abstract the complex structures of graphs and reduce their dimensionality.

标题:图嵌入是一种强大的工具,用于抽象图的复杂结构并降低其维度。这项技术为基于图的机器学习开辟了广泛的用途。

Neo4j 图数据科学 1.4 版是第一个也是唯一一个面向企业的商用图原生机器学习功能。能够从数据中学习泛化的预测特征非常重要,因为组织并不总是知道如何表示连接数据以用于机器学习模型。最新的 Neo4j 版本包括图嵌入算法,这些算法学习用户图的结构,而不是依赖于预先确定的公式来计算特定特征(如中心性得分)。

Neo4j 的首席产品经理兼数据科学家 Alicia Frame 分享了 Neo4j 图数据科学 1.4 版对数据科学家和分析团队的意义。

“我们很高兴将最先进的图嵌入技术融入易于使用的企业软件中,”Frame 博士说。“最新版本的 Neo4j 图数据科学使最先进的技术民主化,并使任何人都可以使用图机器学习。就预测分析可以实现的目标而言,这是一次改变游戏规则的创新。”

英国政府的图嵌入

在 GOV.UK 最近发表的题为“一图统领全局”的博客文章中,数据科学家Felisia LoukouMatthew Gregory 博士 撰写了关于在图数据科学和 Neo4j 知识图谱的帮助下部署其第一个机器学习模型的文章。他们的模型根据用户正在访问的页面自动向 GOV.UK 用户推荐内容。在他们 2020 年 8 月的文章中,他们解释道:

“node2vec 给定任何图,都会学习连续特征表示(一组数字),然后可将其用于各种机器学习任务,例如推荐内容。通过此过程,我们了解到创建支持模型训练和部署的必要数据基础设施是最耗时的部分。”

主要功能

借助 Neo4j 图数据科学,组织现在有了一种全新的方法来从数据中学习,从现有数据集中获得更多价值并持续提高预测准确性。

  • 发现他们甚至不知道要寻找的数据中的新发现:图嵌入(算法)学习数据中结构上的重要信息,从而汇集所有传统图算法收集的泛化超集信息。图嵌入通过采样图的拓扑结构和属性,然后将其复杂性降低到仅那些重要的特征,以便进行进一步的机器学习,从而实现这一点。

  • 当传统算法不足以解决问题时,消除数据平台期。图算法和嵌入可以利用图的拓扑结构和属性来抽象图的结构,从而根据数据点之间的连接(而不是仅根据原始数据)来预测结果。

  • 使用泛化学习对数据进行更快的特征工程,避免在预测特征不明确时测试大量目标算法,并使用FastRP等高性能方法。

  • 通过将GraphSage学习到的函数存储在新机器学习模型目录中,并将它们应用于新数据以生成新的嵌入和预测,持续整合新的数据和预测——无需重新训练模型。

  • 通过添加持续的评分和分类结果,以及预测缺失信息,增强图数据库的价值,从而获得持续改进的洞察力。

Neo4j for Graph Data Science 1.4版本包含三个新的图嵌入选项,这些选项学习图拓扑结构以计算更准确的表示:

  • node2Vec 是一种著名的图嵌入算法,它使用神经网络。

  • FastRP 是一种图嵌入算法,其速度比node2Vec快75,000倍,同时提供同等的准确性,并且即使对于非常大的图也能很好地扩展。

  • GraphSAGE 是一种用于图上归纳表示学习的嵌入算法和过程,它使用图卷积神经网络,并且可以在图更新时持续应用。

除了提供复杂向量表示的图嵌入之外,Neo4j for Graph Data Science的新版本还添加了一般机器学习算法,例如k近邻算法(k-NN),该算法通常用于基于模式的分类,从而更容易从图嵌入中获得见解。

知识图谱补全示例

知识图谱补全在各个领域都具有价值,包括识别基因和疾病之间的新关联、发现新药物以及预测客户和产品之间的关联以提供更好的推荐。从支持领域专家发现他们已知内容的查询,到理解趋势的模式,再到计算用于训练机器学习模型的高价值特征,知识图谱补全离不开图技术。

This image shows a knowledge graph completion workflow.

图片说明:此图片显示了知识图谱补全的工作流程。Neo4j for Graph Data Science 1.4现在支持端到端图机器学习任务的工作流程,例如知识图谱补全。

在药物发现场景中,这意味着不仅要识别基因和疾病或药物和蛋白质之间可能的新关联,还要提供即时上下文以评估这些发现的相关性或有效性。对于客户推荐,这意味着从用户旅程中学习,以预测未来购买的准确推荐,同时在他们的购买历史记录中呈现选项,以增强对建议的信心。

了解更多

了解有关Neo4j for Graph Data Science的更多信息或在此处下载最新版本。1.4版本将在Neo4j在线开发者博览会和峰会(NODES)2020(Neo4j的全球开发者大会)上详细介绍。您还可以观看来自Neo4j Connections for Graph Data Science在线活动的演讲和演示

关于Neo4j

Neo4j是图数据库技术的领导者。作为全球部署最广泛的图数据库,我们帮助全球品牌(包括ComcastNASAUBS沃尔沃汽车)揭示并预测人员、流程和系统之间的相互关系。使用这种关系优先的方法,使用Neo4j构建的应用程序可以解决连接数据挑战,例如分析和人工智能欺诈检测实时推荐知识图谱。在neo4j.com上了解更多信息。

资源

在Twitter上分享此内容

联系方式
pr@neo4j.com
neo4j.com/news/

© 2020 Neo4j, Inc.,Neo Technology®、Neo4j®、Cypher®、Neo4j® Bloom™、Neo4j® Aura™ 和 Neo4j for Graph Data Science™ 是 Neo4j, Inc. 的注册商标或商标。所有其他商标均为其各自公司的财产。