GraphGists

Neo4j 和离岸泄密:阿塞拜疆案例

ICIJ 离岸泄密数据集

作为 2013 年Firepower丑闻的结果,国际调查记者同盟 ( ICIJ ) 发布的离岸泄密数据集在合规/尽职调查领域非常罕见,类似于“电缆门”或五角大楼文件泄密事件。与相对有组织且易于解析的政府泄密事件相比,离岸泄密数据集是从大量泄露的电子邮件和其他文档的详细集合中,通常通过人工提取数据而得出的。该数据集是关于离岸金融中心和避税天堂的宝贵信息库。ICIJ 的调查揭示了许多有趣的模式,包括阿塞拜疆总统可能进行的非法活动。

此图 Gist 用于理解离岸泄密数据集中复杂的数据。

ICIJ 从离岸项目数据中获得的基本经验教训是耐心和毅力。许多成员一开始会输入政客、大亨、涉嫌或被定罪的欺诈者等人员名单,希望银行账户和诈骗阴谋会自动跳出来。这是一条令人沮丧的道路。数据并非如此。

但通过不完整的数据和文档坚持不懈地追寻线索,却取得了一些丰硕的成果:不仅偶尔会发现意想不到的重要人物,而且还会发现更多隐藏财富的微妙而复杂的方案。虽然在离岸交易中众所周知,但一些发现的方案以前从未公开描述过。当这些数据为离岸世界打开新窗口时,耐心得到了回报。

— Duncan Campbell
ICIJ 项目团队如何分析离岸文件

目标

我们想要探索阿塞拜疆总统(例如)如何与离岸账户相关联。为什么这很重要?阿塞拜疆法律禁止参与监督业务的国家官员参与商业活动,包括成为公司的股东。为了了解他的交易,我们需要关注他用来控制其存储在离岸实体中的资产的网络。该网络包括家庭成员、公司、地址以及复杂的中间人和合作伙伴。

总统家族为何设立这些公司尚不清楚。但可以肯定的是,该家族采取了措施掩盖其在这些公司中的参与,利用各种代理人注册公司并至少在名义上对其进行管理。

— Stefan Candea
离岸公司在企业巨头和阿塞拜疆总统之间建立了联系

节点

  • Person:人员是构建和使用资产网络的个人。虽然有些人非常显眼,但另一些人则在幕后工作。

  • Company:公司包括离岸实体、银行服务提供商和企业

  • Address:地址是注册给人员和公司的地址。由于它们具有法律意义(在避税天堂注册的公司支付较低或不支付税款),因此地址可以提供有趣的见解。

关系

  • (Person)-[:USES_ADDRESS]→(Address)(Company)-[:USES_ADDRESS]→Address):人员和公司与地址相关联。

  • (Person)-[:FAMILY]→(Person):人员可以通过家庭关系联系起来。在此模型中,家庭关系非常简单——要么两个人是家人,要么不是。

  • (Person)-[:IS_LINKED_TO {role:'', date:''}]→(Company):人员和公司之间的链接具有属性“role”(例如,DirectorShareholder)和 date,它们标记了人员与公司的关联方式以及关联日期。

  • (Company)-[:IS_LINKED_TO {role:'', date:''}]→(Company):公司和公司之间的 :IS_LINKED_TO 关系类似地具有属性“role”(例如,Master ClientRecords and Registers)和“date”,它们标记了第一个公司与第二个公司的关联方式以及关联日期。

  • (Company)-[:IS_OFFSHORE_PROVIDER_OF]→(Company):离岸服务提供商通常将其专业知识、联系人和有利的税务状况出售给希望利用离岸系统的人。

示例模式

A graph data model of the ICIJ Offshore Leaks dataset
图 1. ICIJ 离岸泄密数据集的图数据模型

John 和 Sam 结婚了,并在他们控制的公司(两人都是股东,John 还是董事)Treasure Ltd 中存储了资产。John 和 Sam 使用了迪拜的一个地址,并在巴哈马建立了 Treasure,使 Treasure 控制的资产变得私密且免税。此外,Treasure 在两家公司的帮助下成立:Good Advice Inc 和 Hide and Seek。Oleg 是 John 的商业伙伴,在俄罗斯有一个地址,他也是 Treasure Ltd 的董事。

此模式是我们对 ICIJ 数据集建模的众多方式之一。虽然此确切示例未出现在原始数据集中,但已将其包含在内以突出人际关系在空壳公司和避税天堂领域的重要性。


示例数据集


哪些资产属于什么人

总统伊尔哈姆·阿利耶夫的直接资产

我们寻找总统与离岸账户之间的直接联系

MATCH (president:Person {first_name:'Ilham'})-[r]->(account:Company) // Find a Person with first name 'Ilham' that is one hop away fom a company
RETURN account.name as Company, account.form as Form, account.incorporation as Incorporation, account.status as Status, r.date as Date, r.role as Role

查询的第一行搜索名为 IlhamPersonCompany 之间所有距离为 1 跳的实例。

第二行返回有关公司以及人和公司之间关系特征的基本信息。在本例中,我们看到Ilham担任Rosamund International Ltd董事股东,这是一家2002年成立的标准国际公司

总统伊尔哈姆·阿利耶夫的间接资产

试图隐藏资金的人往往会使用可以隐藏在背后的代理人。这意味着我们必须扩大搜索范围,寻找间接关联。

例如,使用Neo4j数据库,查找伊尔哈姆·阿利耶夫直接或间接控制的所有海外资产就像在我们的第一个查询中添加一个*一样简单。搜索将返回数据中伊尔哈姆·阿利耶夫和离岸账户之间所有路径。

MATCH (president:Person {first_name:'Ilham'})-[r*]->(account:Company)
RETURN DISTINCT account.name as Company, account.form as Form, account.incorporation as Incorporation, account.status as Status

中间人的作用

一些中间人可能与总统伊尔哈姆·阿利耶夫有着特别紧密的联系和/或重要性。我们可以使用Cypher查找总统扩展网络中的每个公司。然后,我们可以找到与这些公司关联的所有公司,并量化这些中间人公司与网络内公司的紧密程度。

MATCH (president:Person {first_name:'Ilham'})-[r*]->(account:Company)
WITH account
MATCH (account)-[t]-(middlemen:Company)
RETURN middlemen.name as name, count(DISTINCT t) as mentions, type(t) as type, t.role as role
ORDER BY mentions DESC