介绍用于图数据科学的 Neo4j,第一个面向数据科学家的企业级图框架
组织可以使用数据中的网络结构来解决以前无法解决的问题,以实现更好的分析和机器学习
圣马特奥,加利福尼亚州 - 2020 年 4 月 8 日 - Neo4j®,图技术领域的领导者,宣布推出 Neo4j for Graph Data Science™,第一个为企业部署而构建的数据科学环境,旨在利用关系的预测能力。
当前经济环境的不可预测性突出了组织需要从现有数据集中获得更多价值、持续提高预测准确性和满足快速变化的业务需求。Neo4j for Graph Data Science 帮助数据科学家利用高度预测性但尚未得到充分利用的关系和网络结构来解决棘手的问题。示例包括跨多个平台和联系点的用户消歧、识别复杂患者旅程的早期干预措施以及通过看似无害的行为序列预测欺诈。

说明:图数据科学帮助解决从欺诈到个性化和药物再利用的各种行业问题。在 Neo4j Bloom 中可视化。
Neo4j for Graph Data Science 将本地图分析工作区和图数据库与可扩展的图算法和图可视化相结合,提供可靠、易于使用的体验。该框架使数据科学家能够自信地运营更优化的分析和机器学习模型,这些模型根据连接数据和网络结构推断行为。
Neo4j 的首席产品经理兼数据科学家 Alicia Frame 解释了为什么 Neo4j 图数据科学是生成更好预测的最快速方法。Frame 解释说:“数据科学中一个常见的误解是,更多的数据会提高准确性并减少误报。实际上,许多数据科学模型忽略了数据中最具预测性的元素——数据中存在的连接和结构。Neo4j 图数据科学正是为了这个目的而设计的——利用现有数据中固有的关系,提高机器学习的预测精度,或回答以前无法回答的分析问题。”

标题:Neo4j Bloom 提供了对金融交易图及其用于特征工程的图算法结果的可视化探索,这些结果为机器学习模型提供了信息。
以欺诈分析为例,例如检测身份欺诈和欺诈团伙,这涵盖了从金融服务和保险到政府部门和逃税的各个领域。即使是最小的预测改进也能节省数百万美元。Neo4j 图数据科学使在不改变现有机器学习管道的情况下更容易进行这些增量改进。以下是说明 Neo4j 图数据科学如何融入欺诈预测工作流程的一些简单步骤
- 数据科学家可以使用社区检测算法(如 连通分量)来分析行为,从而揭示可疑的交易群体。
- 然后,他们可以通过应用图算法(如 介数中心性 或 PageRank)来深入研究,以揭示隐藏的结构,例如对资金或信息流具有异常影响的账户。
- 分析师可以使用 Neo4j Bloom 以直观的方式探索这些集群,并与欺诈专家协作,推断哪些元素(即特征)最有可能预测犯罪行为。
- 他们可以执行“假设分析”,甚至将图算法的“配方”链接到一个可变的内存工作区,在该工作区中,他们的图可以动态地重塑。
- 一旦算法配方得到验证和理解,它们就可以用于机器学习模型,这些模型被操作化以主动地预防——而不是仅仅检测——欺诈。
Neo4j 图数据科学使数据科学家能够回答只能通过理解关系和数据结构才能解决的问题。图算法是数据科学工具的一个子集,它利用网络结构来推断含义并进行预测,例如
借助 Neo4j 图数据科学,团队可以自信地部署经过验证的解决方案,以大规模运行优化的图算法,处理数十亿个节点,并具有生产特性,例如 确定性播种,它为可重复的机器学习工作流程提供起始值和一致的结果。通过智能地集成网络分析和数据库,Neo4j 自动化数据转换,使用户获得最大分析计算性能和用于持久性的原生图存储。
Ben Squire 是 Meredith Corporation 的高级数据科学家,这是一家领先的媒体和营销服务公司,其出版物每月覆盖 1.9 亿美国消费者,包括近 95% 的美国女性,涵盖广播电视、印刷、数字、移动、语音和视频。Squire 分享了他使用 Neo4j 图数据科学的经验。
“为在线用户提供相关内容,即使是那些未经身份验证的用户,对我们的业务至关重要,”Squire 说。“我们使用 Neo4j 中的图算法将数十亿次页面浏览转化为数百万个具有丰富浏览配置文件的匿名标识符。我们不再是‘在黑暗中做广告’,而是更了解我们的客户,这转化为显着的收入增长和更好地服务的消费者。”
Dr. Alexander Jarasch 是 德国糖尿病研究中心 (DZD) 的数据和知识管理主管,也是 COVIDgraph.org 的合作者,他解释了 Neo4j 图数据科学如何提供具有逻辑参数和 Neo4j Bloom 进行全面图探索的直观数据科学体验。
“今天,没有什么比了解 COVID-19 更紧迫,”Jarasch 说。“图使我们能够将围绕这种令人困惑的疾病的相关信息整合在一起,并提供跨异构数据的综合视图。我们今天对这种冠状病毒的理解受到同行评审研究较少和缺乏长期临床试验的严重阻碍。Neo4j 图数据科学将帮助我们确定需要将生物医学研究、资源和努力方向引导到哪里。”
更多信息
Neo4j 图数据科学是一个图分析工作区和原生图数据库,可实现高计算性能,占地面积小。优化的图算法可以扩展到数十亿个节点,并且可以组合成可重复的工作流程。原生图创建和持久性使内存中图的灵活塑造成为可能。最后,Neo4j Bloom 中的图数据可视化有助于团队以可视化方式探索结果,以便快速原型设计和更有效的协作。

标题:Neo4j 图数据科学结合了三个关键功能领域。可扩展的图算法和分析,原生图数据库以及用于洞察和探索的可视化图探索。
主要功能包括
- 在数十亿个节点和关系上运行的优化并行算法
- 用于一致性的生产特性,例如确定性播种,以加速模型测试
- 可扩展的内存中图,它以并行方式实现,并且可以灵活地聚合和重塑底层源图
- 可变的内存中图,使分析步骤的分层成为可能
- 友好的数据科学体验,具有逻辑内存管理、直观的 API 以及大量文档和指南
- 与 Neo4j 的领先图数据库的原生集成,它会自动转换数据以获得最大的分析计算性能,然后转换回紧凑的图存储以实现持久性
- 图和算法结果的可视化探索,可以与数据科学、开发和业务团队共享,以实现更好的协作
有关 Neo4j 图数据科学的更多信息,请点击此处。在此 博客文章 中了解有关 Neo4j 图数据科学的更多信息。 注册参加 4 月 28 日在首届 Neo4j Connections 在线活动中举行的为期一天的图数据科学演讲和演示。
资源
关于 Neo4j
Neo4j 是领先的图数据库技术,为空中客车、康卡斯特、eBay、NASA、瑞银、沃尔玛等公司推动创新和竞争优势。数千个 社区部署 和 400 多个客户利用 Neo4j 利用连接的数据来揭示人员、流程、位置和系统之间的相互关系。使用这种以关系为中心的 abordagem,使用 Neo4j 构建的应用程序 解决连接的数据挑战,包括人工智能、欺诈检测、实时推荐和主数据。在 neo4j.com 上了解更多信息。
在推特上分享.
联系
pr@neo4j.com
neo4j.com/news/
© 2020 Neo4j, Inc.,Neo Technology®、Neo4j®、Cypher®、Neo4j® Bloom™ 和 Neo4j® Aura™ 是 Neo4j, Inc. 的注册商标或商标。所有其他商标均为其各自公司所有。