知识图谱驱动的糖尿病研究

挑战

大约有七百万德国人患有糖尿病——这是德国最大的常见国民
疾病之一。为了更好地理解其病因,德国糖尿病研究中心(DZD)的科学家从
不同角度研究这种疾病。

德国糖尿病研究中心(DZD)董事会成员 Martin Hrabě de Angelis 教授博士说:“我们的目标是实现跨地点、跨学科、跨物种和跨数据类型的数据访问。同时,德国糖尿病研究中心(DZD)的450多名科学家也应该能够获取外部专业知识。”

解决方案

DZDconnect 是德国糖尿病研究中心(DZD)基于 Neo4j 构建的知识图谱,于2017年推出,为附属医疗保健和医学专业人士提供服务。DZDconnect 叠加在德国糖尿病研究中心(DZD)的关系数据库之上,连接了各医疗中心的系统和数据孤岛。

知识图谱为大规模整合和连接越来越多的数据提供了丰富的平台。DZDconnect 会用最新的医学研究成果进行更新。自然语言处理 (NLP) 读取并自动标注 PubMed 数据中的3000多万篇出版物。算法对文本进行语义分析,对相关实体进行分类,并将其链接到数据库中的内部信息。

德国糖尿病研究中心(DZD)数据与知识管理负责人 Alexander Jarasch 博士解释说:“如果没有自然语言处理 (NLP) 等技术的辅助,阅读和吸收最新出版物中的信息根本不可行。”“目前,在一台不错的机器上分析一篇摘要大约需要1.5秒。虽然听起来很快,但要总结所有3000万篇出版物实际上需要一年半的时间。我们使用自然语言处理 (NLP) 和图技术的方法并行运行,并在后台自动化完成。”

Neo4j 图数据科学库发挥着重要作用。其中一个目标是识别2型糖尿病的不同亚型,以提供更好的治疗(精准医学)。借助集成的算法,科学家可以对数据集进行细分。社区检测算法根据预定义的参数识别患者集群,使研究人员能够更精确地进行研究。算法寻找糖尿病亚型的属性,并识别共同特征(例如,身高、体重、药物或遗传缺陷)。

用例

  • 知识图谱

行业

  • 医疗保健与生命科学

使用的产品

  • Neo4j 图数据科学
  • 欧洲

探索更多