使用 Neo4j 构建美国东部最大铁路的数字孪生
当您查看存储在图数据库中的信息的可视化时,您会看到一个由节点和边以及它们之间所有连接方式组成的网络。然后,如果您查看铁路网络的地图,您会立即开始注意到它们是多么相似。
美国东海岸最大铁路的 IT 团队负责跟踪、追溯、监控和响应沿线发生的一切,他们也注意到了这种相似性。CSX 使用 Neo4j 绘制铁路系统图,该系统服务于美国约三分之二的人口,拥有超过 2 万英里的线路、约 2.1 万名员工和 125 亿美元的收入。
正如您所想象的,CSX 的运营非常依赖资产,货物每天进出货运站。这些高度流动的资产之间的关系对 CSX 的核心业务至关重要。Neo4j 帮助 CSX 理解其网络。
数据概览:CSX
- Neo4j 中的资产和设备
- 24,000 台机车
- 6,700 名列车乘务人员
- 每天 1,600 趟列车
- 263,000 节铁路货车
- 1,100 个 CSX 里程碑
- 平台:Neo4j Enterprise
“如果你考虑图数据库本身,它的节点和边,铁路网络本身几乎就是它的象征。如果你考虑所有的铁路线,它们就是边,而我们的每个货场和枢纽都是节点,它们关系到你如何通过网络传输以及如何发送你的货物和服务,”CSX IT 服务企业架构负责人 Dave Rich 说。“这极其复杂。”
创建物理网络的数字孪生
作为一家近 200 年历史的公司,CSX 面临着与遗留系统和手动报告相关的挑战。
Rich 和他的团队的任务是使保持铁路运行和随时间演进的技术现代化。为实现这一目标,团队致力于减少系统中人为偏见的影响,并为日常运营开发一个单一的真相来源。
Rich 说,将这些数据放入 Neo4j 图数据库“是一项伟大的技术,有助于我们改进看待事物的方式,从而改善业务。”
CSX 团队使用 Neo4j 运行一个通过近实时图表示的集中式货运数据存储库,以提供更准确、更精细的资产跟踪。为此,该团队有效地创建了其物理网络的数字孪生,包括机车、铁路货车、客户、货运订单、铁路线上的里程碑,以及这些元素之间随时间存在的所有关系。
优质数据的深远影响
拥有更高的可见性和准确、单一的真相来源对 CSX 显然是有帮助的。但优质数据的影响超越了内部运营。当客户想知道货物的位置,或者团队需要详细了解那些铁路货车中实际装载了什么时,CSX 可以利用其图数据库获取正确的信息。
Rich 说:“它增加了信息频率,并利用图数据库扩展 API,这些 API 可以与其他业务系统和运输管理系统互联互通,而在此之前这将非常复杂。”
“这有助于我们从商业角度解锁,我们的客户如何真正整合并更多地成为我们供应链的一部分,以及我们如何坦率地说,在未来成为他们供应链的重要组成部分。”

与图数据库共同成长
随着 CSX 更好地理解其数据,它不得不重新思考其在图数据库中的关系。团队在此过程中面临的一个挑战是编写输入到 Neo4j 的业务规则。由于某些事件信息流的不一致(以及一些手动报告),CSX 图数据库中填充了重复节点。项目中的软件工程师意识到他们的方法导致了重复,他们通过重新思考系统中某些事件的定义方式解决了这个问题。
“我们在最初创建数据时并没有完全理解它,”CSX 软件工程师 Dean Schaefer 说,他曾在奥斯汀的 Neo4j GraphConnect 2022 大会上发表演讲。“然后我们回去,看到这些边缘案例出现,我们意识到我们需要调整我们的实现方式。”
正是 Cypher 图数据库查询语言的深度和灵活性提供了通过 MERGE 语句解决问题的方案,这本质上是针对指定模式的放置操作。
“我们基本上从依赖状态的插入转向了不可变插入策略,”Schaefer 说。“因此,我们不再查询您当前的行程来查找您的设备节点和里程碑节点,而是调整了我们的图模式,为每个事件创建一个新的行程节点。我们不再试图将事件累积到特定的装载或空载事件以创建行程的逻辑连贯性,而是为该设备创建了一个代表时间点、时间动作的新行程节点。”
物流领域的颠覆者
图数据库非常适合 CSX。“我们的铁路网络几乎就是我们图数据库的镜像。如果你考虑图数据库本身的技术,也就是节点和边,”Rich 说。“所以它确实帮助我们高效地跟踪、报告和可视化数十万资产以及它们随时间推移的相互关系和演变方式。”
具体来说,CSX 的 Neo4j 实例包含了 24,000 台机车,其中 3,500 台属于 CSX,其余来自合作铁路公司。该系统每天捕获 1,600 趟列车、超过 25 万节铁路货车以及 CSX 网络中 1,100 多个站点的信息。
Rich 说:“因此,如果您考虑所有这些不同资产之间以及随时间发生的各种不同事件之间的关系有多么复杂,图数据库非常适合我们从铁路物流的角度来帮助理解每天发生的关系和事件。”