GraphGists

语义链接癌症模型

此图 gist 提供了一组 Cypher 查询,以使用属性图数据模型作为将癌症模型描述与元数据链接起来的方法。

癌症“模型”是指构成“模拟”基础的“数学”或“计算”模型。在这种情况下,我们指的是癌症生物学建模,因此指的是癌症功能和进展的模拟(即预测的癌症过程)。“模型描述”是对模型的抽象,包括元数据以及对模型实现(可能是代码或可执行文件)的引用。模型通常具有一些初始状态,其中模拟会产生该状态的一些变化或渐进变化。在癌症模型的情况下,我们可能有一些起始参数和肿瘤的 3D 模型,当运行模拟时,参数会更新,并且 3D 模型会发生变化以反映肿瘤生命周期随时间的预测。有关癌症生物学介绍,请查看此处提供的免费电子书 https://bookboon.com/en/introduction-to-cancer-biology-ebook

我们认为,在属性图中表示癌症模型集合将使我们能够创建可查询的系统,通过这些系统,我们可以通过与领域数据的语义链接来探索癌症模型的组合。使用属性图数据模型背后的理念是能够通过特定于领域的元数据(例如单位、计算类型以及生物学术语和分类学分类)将不同的癌症模型链接在一起。

使用此数据库,我们可以提出以下问题

  • 哪些癌症模型属于同一类别?

  • 哪些癌症模型具有共同的输入和输出参数?

  • 哪些癌症模型是直接或间接链接在一起的?

数据模型

实体

  • MODEL - 表示抽象模型描述

  • PARAMETER - 表示模型接口参数

  • CATEGORY - 表示癌症模型分类的元数据

  • TERM - 表示受控词汇表术语的元数据

  • UNIT - 表示度量单位的元数据

  • PERSON - 表示一个人

  • ORGANISATION - 表示一个组织

关系

  • HAS_INPUT - 将模型与其输入参数连接起来

  • HAS_OUTPUT - 将模型与其输出参数连接起来

  • HAS_METADATA - 将模型和参数连接到元数据

  • HAS_CATEGORY - 将类别与其他类别连接起来(即子类别)

  • CONTAINS - 将模型与其他子模型连接起来(以显示模型组成)

  • SYNONYM_OF_TERM - 将术语与其同义词连接起来

  • CREATED_BY - 将模型与模型的创建者(或作者)连接起来

  • CONTRIBUTED_BY - 将模型与模型描述的发布者(即数据库记录)连接起来

查询控制台

填充图 顶部

可视化图 顶部

以下是使用癌症模型描述的测试数据集对整个属性图进行可视化的示例。有关所用癌症模型的更多信息,请查看我们的论文“语义链接计算机模拟癌症模型” https://www.la-press.com/semantically-linking-in-silico-cancer-models-article-a4552

完整的图本身并没有特别有用。但是,它为更有趣的查询(例如以下查询)提供了基础。


癌症模型描述

这就是模型如何被可视化为属性图。在这种情况下,这是 Z. Wang 等人在“使用多尺度基于代理的模型模拟非小细胞肺癌,Theor Biol Med Model,4(1):50+,2007 年 12 月”中提出的 EGFR-ERK 分子通路模型。 https://dx.doi.org/10.1186/1742-4682-4-50

EGFR-ERK Pathway as property graph

模型具有元数据,例如创建者、贡献者、发布者、模型分类(例如肺癌、均匀肿瘤块、亚细胞尺度)以及输入和输出参数(例如 EGF 浓度、细胞周期时间)。参数可以链接到领域图中表示的其他领域元数据。

领域元数据

类别

  • 癌症模型的分类学分类。

MATCH (n:Category)
RETURN collect(n.name) AS Categories

单位

  • 数值单位,包括 SI 单位和一些派生单位。

MATCH (n:Unit)
RETURN collect(n.name) AS Units

CLI 数据类型

  • 命令行界面数据类型,例如字符串、文件名和格式不同的数字。

MATCH (n:Type)
RETURN collect(n.name) AS CLIdatatypes

人员和组织

  • 对模型开发或描述拥有某种所有权或贡献权的外部实体。

MATCH (n:Person)-[:MEMBER_OF]-(m:Organisation)
RETURN n.name AS Name, m.name AS Organisation

哪些癌症模型使用连续数学建模? 顶部

MATCH (n:Model)
WHERE (n)-[:HAS_METADATA]-({ name:'Continuous'})
RETURN n.title AS Model

哪些癌症模型具有共同且兼容的输入和输出参数? 顶部

MATCH (n:Model)-[:HAS_INPUT]-(p:Parameter)-[:HAS_METADATA]-(meta:Term)-[:HAS_METADATA]-(q:Parameter)-[:HAS_OUTPUT]-(m:Model)
WHERE n<>m
RETURN DISTINCT m.title AS ModelA, n.title AS ModelB, q.name AS OutputA, p.name AS InputB, meta.term

在多尺度 Alarcon 2003 模型中,组件模型和对应尺度是什么? 顶部

MATCH (n:Model {URN: 'urn:miriam:tumor:000013'})-[:HAS_METADATA]-(:Category {name: 'Multiscale'}), (m:Model)
MATCH (n)-[:CONTAINS]-(m)
MATCH (m)-[:HAS_METADATA]-(scale:Category)-[:HAS_CATEGORY]-(:Category {name: 'Single-scale'})
RETURN m.title AS ComponentModel, scale.name As Scale