NYP 利用 Neo4j 推进分析以追踪感染
挑战
阻止感染传播是医院面临的关键问题。
纽约长老会医院的分析项目负责人迈克尔·泽勒内茨着手制定追踪感染传播的方法。泽勒内茨及其团队试图找到连接点,以便医院工作人员可以集中精力减少或消除感染。
但追踪传染病需要了解感染患者在哪里以及何时在那里。“对我们来说,能够查看跨时间和空间的事件非常重要,”泽勒内茨说。“我们希望能够提出诸如‘谁在他们住院期间感染了?’以及‘他们在感染时与谁同住?’之类的问题。我们在对空间和时间的关系进行建模方面遇到了困难。”
地图指明了事件发生的地点,但没有指明时间。时间序列记录了事件的顺序,但没有指明发生的地点。
追踪感染需要将这些数据结合起来。“我们不断遇到的问题是,我们想知道患者在就诊期间发生了什么,以及他们在某个事件发生时在哪里,”泽勒内茨说。
解决方案
图形技术提供了一种灵活的方法来连接事件的所有维度:什么、何时以及何地发生。
该团队建议使用 Neo4j 来绘制空间和时间的图形。他们希望记录发生在医院中的所有事件——从患者入院的时间到他们进行的所有检查以及出院。
首先,泽勒内茨寻找在 Neo4j 中创建时间树以对时间序列数据进行建模的方法。他使用在 Neo4j 博客文章中找到的代码创建了时间树。然后,他创建了位置树以对设施中的所有房间进行建模。
数据建模是任何 Neo4j 项目的关键部分。可视化他们的初始模型揭示了大量的关系,但这本身并不能满足他们的目标。Zelenetz 决定添加一个事件实体来连接时间和位置树。
事件实体包含时间、空间、地点和持续时间,并带有事件开始和结束的时间戳。
包含事件实体使数据模型变得灵活;他们创建的图可以服务于多个用例,并最终使 NYP 的分析团队能够分析其设施中发生的一切。
Zelenetz 将他创建的图数据集输入到一个社区检测图算法中。该算法将事件分组到不同的专业领域,例如肿瘤学和儿科,验证了团队的工作。
下载案例研究