那是 2016 年 11 月 9 日的晚上——美国总统大选后的第二天——我和女儿的幼儿园老师坐在一起,她即将讲述的故事很快就会超越任何家长会上的典型话题。

我女儿的幼儿园位于东帕洛阿尔托,是硅谷市区贫困的继子。东帕洛阿尔托和帕洛阿尔托的人均收入差距为 52,000 美元,65% 的东帕洛阿尔托居民是拉丁裔,与帕洛阿尔托(6%)和门洛帕克(18%)等邻近城市形成鲜明对比。虽然东帕洛阿尔托的凶杀案发生率不再是全美最高的,但该地区的帮派战争、毒品滥用和家庭暴力(以及所有相关的恶习)仍然存在。

我女儿的老师告诉我,在唐纳德·J·特朗普被宣布为美国总统大选获胜者后的前 19 个小时里,隔壁小学的学生咨询师接到了大量的预约。令我震惊和恐惧的是,她告诉我,许多小学生在选举结果公布后试图自杀或自残(割伤等)。一个三年级的男孩,是一位来自危地马拉的移民的儿子,想知道如果他母亲被驱逐出境,他还能上学吗?

对于这些在硅谷贫困阴影中长大的孩子来说,特朗普的言论似乎不仅仅是空话。对他们来说,这太真实了。

这些故事显然让我深感不安,但作为一名乐观的人,我想给新当选总统一个机会:毕竟,也许特朗普只是为了当选才说了一些话。

The Neo4j team condemns Trump's executive order on refugees; we respond with better data journalism


言论的升级——以及它越过底线的地方


但当特朗普从候选人变成当选总统时,反移民言论并没有平息,反而更加强烈。现在,在他任期开始一周多一点的时间里,这种言论已经变成了现实。特朗普的行政命令“保护国家免受外国恐怖分子进入美国”已经超出了我的底线,我与科技界的大多数人并肩站在一起谴责这一命令,因为它确实是反移民和宗教歧视。我认为这是道德错误,它对企业有害,它不会使美国或世界更安全。

如果特朗普在竞选期间和当选总统期间没有如此明确且持续地持反穆斯林立场,我可能不会那么担心(毕竟,“关注国家”名单中并不包括所有穆斯林占多数的国家)。但是,我们必须在特朗普迄今为止所说的一切的背景下看待这份行政命令:特朗普多次公开表示,我们应该禁止所有穆斯林进入美国,并登记已经在美国境内的穆斯林

此外,在行政命令本身的文本中,特朗普还允许来自这些国家的基督教徒和其他宗教少数民族享有更高的难民处理优先权,通过官僚程序的调整,排挤了未被提及但暗示的穆斯林同行。

这是一个宗教歧视的平台。今天的安妮·弗兰克是一个叙利亚女孩,当这种反移民言论成为现实时,保持沉默是不道德的。让我们知道,Neo Technology坚决反对特朗普行政命令中的仇外心理和宗教歧视

幕后更大的问题


撇开这个令人不安的行政命令,我认为美国政治面临着一个更大的问题——两党都是如此。

如今的政治话语越来越少地基于事实和客观真理,我认为这是令人担忧的。这对我们 Neo Technology 来说尤其令人沮丧,因为我们的使命是帮助世界理解数据。在我们的核心,我们希望每个人都有更多基于事实、信息充足的论据(无论这些论据发生在政治、商业还是其他地方)。

2016 年美国总统大选中,事实性话语面临的一大挑战是假新闻。不幸的是,这个词在大选后的几个月里被用来指代从有偏见的新闻到耸人听闻和点击诱饵文章的任何东西。这些也是问题,但我具体指的是故意编造的耸人听闻的故事,通常是为具有特定党派偏见的读者设计的。

著名的例子包括泄露克林顿邮件后被发现死亡的联邦调查局特工教皇支持特朗普,以及克林顿向 ISIS 出售武器。这些都被发现是客观上错误的、故意编造的,然而它们在社交媒体上的传播范围却超过了大多数“主流媒体”的新闻文章。我相信这样的故事严重影响了美国大选,我也看到类似的事情在我的祖国瑞典发生,损害了真实和智力诚实的公共话语。

幸运的是,我相信假新闻问题可以解决,而且Neo4j以及更广泛的图形社区在解决这个问题方面发挥着作用。因此,我今天宣布我们将采取两项具体的行动

Neo4j 数据新闻奖学金


去年,国际调查记者联盟 (ICIJ) 的一小群记者和三名开发者打破了创纪录的巴拿马文件调查,该调查筛选了新闻史上最大的数据泄露。对我们 Neo4j 来说,这段经历令人大开眼界,因为我们第一次看到了图形数据库技术在调查记者手中所能产生的惊人全球影响。

基于这种经验,我们加大了对数据新闻的投入,并在之后推出了Neo4j 数据新闻加速器计划。通过这个计划,我们与来自世界各地的数百名调查记者和学生合作,继续帮助世界理解调查数据。

今天,我们将这种承诺推向下一个合乎逻辑的步骤,并推出 Neo4j 数据新闻奖学金。在与现有新闻机构合作时,我们将赞助一名调查记者,让他们与社会关注的公共和私有数据集合作。我们仍在完善细节,但有一点是明确的:调查新闻将在政府问责制中发挥越来越重要的作用,而调查新闻的未来是数据。

(一旦我们有了关于奖学金的更多细节,我们会通知您,并鼓励所有数据记者申请。)

新闻的 PageRank


我们现在面临的假新闻情况与 90 年代后期网络搜索面临的挑战惊人地相似。当时,在用户搜索结果的顶部,总是出现太多无关(或不准确)的结果,即AltaVista 效应。雅虎的解决方法是通过人工编辑来手动整理网络内容,但随着互联网规模和复杂性的增长,这很快变得不可能。

谷歌采取了不同的方法。随着 PageRank 算法的出现,谷歌找到了一种(图形)算法方法来过滤网络结果,并在搜索结果的顶部只提供最相关的链接。

假新闻问题没有区别:现在,我们依靠人工编辑和管理者来区分真实新闻和假新闻。随着越来越多的新闻来源上线,以及马其顿的内容工厂以越来越快的速度运转,跟上信息流将比现在更难。但如果我们有一个新闻的 PageRank,它可以根据包括网站之间图形重叠在内的各种信号计算出一个信任分数,那么算法就可以帮助读者区分事实和虚构。

我相信这样的算法可以起源于三个地方
    • 谷歌(发明了第一个 PageRank 的公司)
    • Facebook(他们已经面临着过滤假新闻的公共关系压力)
    • 我们,开源图形社区(因为为什么不呢?)
所以,这是我对更广泛的图形社区的挑战:如果你关心假新闻问题,如果你像我一样热衷于基于事实的公共话语,那么这是一个你的研究和新颖的图形思想真正能够影响世界的领域。帮助我们帮助世界理解(新闻)数据。