推出 Neo4j for Graph Data Science,第一个面向数据科学家的企业图框架


组织可以利用数据中的网络结构解决以前难以处理的问题,以获得更好的分析和机器学习能力


加利福尼亚州圣马特奥市 – 2020 年 4 月 8 日 – 图技术领域的领导者 Neo4j® 宣布推出 Neo4j for Graph Data Science™,这是第一个旨在利用关系预测能力的面向企业部署的数据科学环境。

当前经济气候的不可预测性凸显了组织需要从现有数据集中获取更多价值、持续提高预测准确性并满足快速变化的业务需求。Neo4j for Graph Data Science 帮助数据科学家利用高度预测性但很大程度上未被充分利用的关系和网络结构来解决棘手的问题。例如,跨多个平台和接触点识别用户、为复杂的患者旅程确定早期干预措施以及通过一系列看似无害的行为预测欺诈。

标题:图数据科学有助于解决从欺诈到个性化和药物再利用等各行业的问题。在 Neo4j Bloom 中可视化。

Neo4j for Graph Data Science 将原生图分析工作区和图数据库与可扩展的图算法和图可视化相结合,提供可靠、易用的体验。该框架使数据科学家能够自信地将基于连接数据和网络结构推断行为的更优分析和机器学习模型投入运营。

Neo4j 首席产品经理兼数据科学家 Alicia Frame 解释了为什么 Neo4j for Graph Data Science 是生成更好预测的最快捷方式。“数据科学中一个常见的误解是,更多数据可以提高准确性并减少误报,”Frame 解释道。“实际上,许多数据科学模型忽视了数据中最具预测性的元素——其中存在连接和结构。Neo4j for Graph Data Science 正是为了这个目的而设计的——利用现有数据中固有的关系,提高机器学习的预测准确性,或回答以前无法回答的分析问题。”

标题:Neo4j Bloom 提供金融交易图的视觉探索以及用于特征工程的图算法结果,为机器学习模型提供信息。

以欺诈分析为例,例如检测身份欺诈和欺诈团伙,这涵盖了从金融服务和保险到政府部门和逃税等领域。即使是最小的预测改进也能节省数百万美元。Neo4j for Graph Data Science 使在不改变现有机器学习流水线的情况下更容易实现这些增量改进。下面是说明 Neo4j for Graph Data Science 如何融入欺诈预测工作流的一些简单步骤:

  1. 数据科学家可以使用社区检测算法(例如连通分量)来分析行为,从而揭示可疑的交易群体。
  2. 然后,他们可以通过应用图算法(例如介数中心性PageRank)深入研究,以揭示隐藏的结构,例如对资金或信息流有异常影响的账户。
  3. 分析师可以使用Neo4j Bloom以直观的方式探索这些集群,并与欺诈专家协作,推断哪些元素(即特征)最有可能预测犯罪行为。
  4. 他们可以在可变的内存工作区中执行“假设”分析,甚至可以将图算法的“配方”串联起来,以便实时重塑图。
  5. 一旦算法配方得到验证和理解,它们就可以用于机器学习模型,这些模型被投入运营以主动预防——而不仅仅是检测——欺诈。

Neo4j for Graph Data Science 使数据科学家能够回答只有通过理解关系和数据结构才能解决的问题。图算法是数据科学工具的一个子集,它利用网络结构来推断意义并进行预测,例如:

借助 Neo4j for Graph Data Science,团队可以自信地部署经过验证的解决方案,以大规模运行优化后的图算法,处理数百亿个节点,并具备生产级功能,例如确定性种子,它为可重现的机器学习工作流提供起始值和一致结果。通过网络分析和数据库的智能集成,Neo4j 自动化数据转换,因此用户可以获得最大的分析计算性能和原生的图存储持久性。

Meredith Corporation 的高级数据科学家 Ben Squire 分享了他使用 Neo4j for Graph Data Science 的经验。Meredith Corporation 是一家领先的媒体和营销服务公司,其出版物每月覆盖 1.9 亿不重复的美国消费者,其中包括近 95% 的美国女性,业务涵盖广播电视、印刷、数字、移动、语音和视频。

“为在线用户提供相关内容,即使是那些未认证的用户,对我们的业务也至关重要,”Squire 说。“我们使用 Neo4j 中的图算法将数十亿次页面浏览转化为数百万个带有丰富浏览档案的假名标识符。我们现在不再是‘盲目地投放广告’,而是更好地了解我们的客户,这带来了显著的收入增长并更好地服务了消费者。”

德国糖尿病研究中心(DZD)的数据和知识管理负责人以及 COVIDgraph.org 合作者 Alexander Jarasch 博士解释了 Neo4j for Graph Data Science 如何通过逻辑参数和 Neo4j Bloom 提供直观的数据科学体验,实现全面的图探索。

“如今,没有什么比了解 COVID-19 更紧迫了,”Jarasch 说。“图使我们能够汇集关于这种令人困惑的疾病的相关信息,并提供跨异构数据的综合视图。目前对这种冠状病毒的了解受到同行评议研究极少和长期临床试验缺乏的严重阻碍。Neo4j for Graph Data Science 将帮助我们确定需要将生物医学研究、资源和努力导向何处。”

更多信息

Neo4j for Graph Data Science 是一个图分析工作区和原生图数据库,具有高性能计算和紧凑的占用空间。优化后的图算法可扩展到数百亿个节点,并可组合成可重现的工作流。原生图创建和持久化使内存图能够灵活地塑形。最后,Neo4j Bloom 中的图数据可视化帮助团队以可视化方式探索结果,从而快速进行原型设计和更有效的协作。

标题:Neo4j for Graph Data Science 结合了三个关键功能领域。可扩展的图算法和分析、原生图数据库以及用于洞察和探索的可视化图探索。

主要功能包括:

    • 在数百亿个节点和关系上运行的优化并行算法
    • 生产级功能,例如确定性种子,以确保一致性,从而加速模型测试
    • 可扩展的内存图,可并行实例化,并可灵活聚合和重塑底层源图
    • 可变的内存图,允许分层分析步骤
    • 友好的数据科学体验,具有逻辑内存管理、直观的 API 和丰富的文档及指南
    • 与 Neo4j 领先的图数据库原生集成,可自动转换数据以实现最大的分析计算性能,然后将其转换回紧凑的图存储以实现持久化
    • 对图和算法结果进行可视化探索,可在数据科学、开发和业务团队之间共享,以实现更好的协作

有关Neo4j for Graph Data Science 的更多信息可在此处获取。在此博客文章中阅读有关 Neo4j for Graph Data Science 的更多内容。注册参加 4 月 28 日首届Neo4j Connections在线活动,全天参加图数据科学讲座和演示。

资源

关于 Neo4j

Neo4j 是领先的图数据库技术,推动空中客车、ComcasteBayNASA瑞银沃尔玛等公司的创新和竞争优势。数千个社区部署和 400 多家客户利用 Neo4j 处理连接数据,揭示人、流程、位置和系统之间的相互关系。通过这种关系优先的方法,使用 Neo4j 构建的应用程序解决了连接数据挑战,包括人工智能、欺诈检测、实时推荐和主数据。访问 neo4j.com 了解更多信息。

在 Twitter 上分享.

联系方式
pr@neo4j.com
neo4j.com/news/

© 2020 Neo4j, Inc., Neo Technology®, Neo4j®, Cypher®, Neo4j® Bloom™ 和 Neo4j® Aura™ 是 Neo4j, Inc. 的注册商标或商标。所有其他标志均归其各自公司所有。