GraphGists

FINRA图谱

在每个交易日结束时,FINRA都会发布市场上领先的证券,类别包括交易量、市值和价格。他们还会发布市值和价格下跌的股票。这些信息可以从任何每日金融服务数据源获取。其中之一是https://google.com/finance

生成的数据形成了一个图谱

riy240k

如您所见,此图谱不仅对当天的提及很有趣,而且还包括一段时间内的提及。如果一只股票今天和昨天都被提及,这是否具有重要意义?这是否有趣?

是的,很有趣。可以针对此图谱进行各种分析。其中一项分析是所有提及股票的出现次数直方图

tY0qUL7

嗯。非常倾斜:AAPL在最右边,实际上其他所有TOP5都在0-10(不含10)范围内。那么,让我们看看那些提及次数少于十次的股票。这是否令人感兴趣?

TpAGSpA

是的,这很有趣!大多数股票只出现一次(在过去9个月存档的数据中)。那么,那些在TOP5列表中出现多次的股票呢?那里是否存在某种模式?嗯。我们必须进一步研究这个问题,但是这些有趣的模式之所以得以体现,是因为图数据库允许我们挑选出有趣的股票,然后将其暴露于分析中。

设置图谱

此数据库是一个托管在https://grapheneDB.com上的Neo4j图谱。它每天都会更新,更新程序名为“scrape”,该程序从Google Finance网站上获取TOP5,将抓取的HTML转换为内部关系结构,然后将其转换为发送到Neo4j的JSON-Cypher查询。

此模块称为Analytics.Trading.Web.Upload.Cypher。通过POST发送的Cypher查询类似于以下示例,用于建立将添加TOP5证券的日期

然后,在建立日期后,会添加股票,每个Cypher语句都在一个大型POST推送中。

提取当日TOP5以进行观察和分析

match (d:Day { month: 7 }) where d.day > 10
return d

上面提到的直方图只是通过出现次数对符号进行计数的结果。我目前使用自己的一套分析工具在图数据库中使用Cypher以及在外部使用我的LoC:Haskell来执行此操作。在一天结束时,我会选择一个来自TOP5的感兴趣的股票,然后发布一份报告,其中包括SMA(“简单移动平均线”)、EMA(“指数移动平均线”)和随机指标技术指标。最终产品是每日推文

结论

股票市场很大。太大了。但是,通过关注交易量排名前5的股票,我们可以缩小范围,关注市场领导者,并寻找那里有趣且可能有利可图的模式。通过将这些信息连接到图数据库中,这些模式变得清晰,并允许我们分析它们,以及允许我们探索和发现简单股票筛选方法会忽略的新模式。股票市场远非逐行、逐笔交易的枯燥乏味,在这些交易中,关系和模式从图数据库提供的可视化中获益匪浅。