GraphGists

癌症模型的语义链接

此GraphGist提供了一组Cypher查询,旨在使用属性图数据模型将癌症模型描述与元数据连接起来。

癌症'模型'是指构成'模拟'基础的'数学'或'计算'模型。在这种情况下,我们指的是癌症生物学建模,因此也指癌症功能和进展的模拟(即癌症的预测过程)。'模型描述'是模型的抽象,包含元数据以及对模型实现的引用(可能是代码或可执行文件)。模型通常具有一些初始状态,模拟会在该状态中产生一些变化或渐进变化。对于癌症模型,我们可能有一些起始参数和肿瘤的3D模型,运行模拟时,参数会被更新,3D模型也会发生变化,以反映肿瘤生命周期的随时间变化预测。有关癌症生物学入门,请在此处查看免费电子书:https://bookboon.com/en/introduction-to-cancer-biology-ebook

我们相信,在属性图中表示癌症模型集合,有助于创建可查询的系统,通过这些系统,我们可以通过与领域数据的语义链接来探索癌症模型的组合。使用属性图数据模型背后的想法是能够通过领域特定的元数据将不同的癌症模型连接起来,例如单位、计算类型以及生物学术语和分类法类别。

通过这个数据库,我们可以提出以下问题,例如

  • 哪些癌症模型属于同一类别?

  • 哪些癌症模型具有共同的输入和输出参数?

  • 哪些癌症模型是直接或间接连接在一起的?

数据模型

实体

  • MODEL - 表示一个抽象的模型描述

  • PARAMETER - 表示一个模型接口参数

  • CATEGORY - 表示癌症模型分类的元数据

  • TERM - 表示受控词汇术语的元数据

  • UNIT - 表示度量单位的元数据

  • PERSON - 表示一个人

  • ORGANISATION - 表示一个组织

关系

  • HAS_INPUT - 将模型与其输入参数连接

  • HAS_OUTPUT - 将模型与其输出参数连接

  • HAS_METADATA - 将模型和参数与元数据连接

  • HAS_CATEGORY - 将类别与其他类别(即子类别)连接

  • CONTAINS - 将模型与其他子模型连接(以显示模型构成)

  • SYNONYM_OF_TERM - 将术语与同义术语连接

  • CREATED_BY - 将模型与其创建者(或作者)连接

  • CONTRIBUTED_BY - 将模型与模型描述的发布者(即数据库记录)连接

查询控制台

填充图 顶部

可视化图 顶部

下方是使用癌症模型描述测试数据集对整个属性图进行的可视化。要了解更多有关所用癌症模型的信息,请查阅我们的论文《体外癌症模型的语义链接》:https://www.la-press.com/semantically-linking-in-silico-cancer-models-article-a4552

完整的图本身并没有特别大的用处。然而,它为进行更有趣的查询(例如下面的查询)提供了基础。


癌症模型描述

这是模型作为属性图的可视化方式。在这种情况下,这是Z. Wang等人发表于《Simulating non-small cell lung cancer with a multiscale agent-based model, Theor Biol Med Model, 4(1):50+, Dec. 2007》中的 EGFR-ERK 分子通路模型。 https://dx.doi.org/10.1186/1742-4682-4-50

EGFR-ERK Pathway as property graph

模型具有元数据,例如创建者、贡献者、发布者、模型分类(例如肺癌、均匀肿瘤块、亚细胞尺度)以及输入和输出参数(例如EGF浓度、细胞周期时间)。参数可以链接到在领域图中表示的其他领域元数据。

领域元数据

类别

  • 癌症模型的分类法类别。

MATCH (n:Category)
RETURN collect(n.name) AS Categories

单位

  • 包括SI单位和一些导出单位的数值单位。

MATCH (n:Unit)
RETURN collect(n.name) AS Units

CLI数据类型

  • 命令行界面数据类型,例如字符串、文件名和不同格式的数字。

MATCH (n:Type)
RETURN collect(n.name) AS CLIdatatypes

人员与组织

  • 对模型开发或描述拥有所有权或做出贡献的外部实体。

MATCH (n:Person)-[:MEMBER_OF]-(m:Organisation)
RETURN n.name AS Name, m.name AS Organisation

哪些癌症模型是使用连续数学建模的? 顶部

MATCH (n:Model)
WHERE (n)-[:HAS_METADATA]-({ name:'Continuous'})
RETURN n.title AS Model

哪些癌症模型具有共同且兼容的输入和输出参数? 顶部

MATCH (n:Model)-[:HAS_INPUT]-(p:Parameter)-[:HAS_METADATA]-(meta:Term)-[:HAS_METADATA]-(q:Parameter)-[:HAS_OUTPUT]-(m:Model)
WHERE n<>m
RETURN DISTINCT m.title AS ModelA, n.title AS ModelB, q.name AS OutputA, p.name AS InputB, meta.term

在多尺度Alarcon 2003模型中,组件模型和相应的尺度是什么? 顶部

MATCH (n:Model {URN: 'urn:miriam:tumor:000013'})-[:HAS_METADATA]-(:Category {name: 'Multiscale'}), (m:Model)
MATCH (n)-[:CONTAINS]-(m)
MATCH (m)-[:HAS_METADATA]-(scale:Category)-[:HAS_CATEGORY]-(:Category {name: 'Single-scale'})
RETURN m.title AS ComponentModel, scale.name As Scale

© . All rights reserved.