文档的实时图分析为公司节省超过400万员工工时
挑战
由于思科销售渠道的广度,存在大量内容,例如
文档、文件和演示文稿——在思科销售团队所依赖的内部数据库中。
以签下潜在客户。
然而,存在一个严重的内容查找问题:每位销售人员每天花费高达一小时
试图找到与其潜在客户需求相关的内容。
该公司此前依赖于一个典型的索引驱动搜索引擎,员工可以通过
一系列关键词进行搜索。但是,由于文件没有被分配元数据,因此难以
查找相关内容。
思科内容服务总监 Prem Malhotra 表示:“问题在于内容太多,并且对内容缺乏更深入的理解。”
思科内容服务总监 Prem Malhotra 表示:“我们必须自问,‘我们如何才能
让搜索引擎表现得更好,以及缺少了什么关键环节?’”
解决方案
思科转向 Neo4j 来解决这些挑战。
为了给思科大量的历史文档分配元数据,第一步是
将文件类型——例如 Microsoft Word 和 PDF——转换为潜在狄利克雷
分配 (LDA) 格式,以便文档可以被大型数据平台进行聚类。
文档聚类完成后,一组常用关键词和短语被输入到
Neo4j 中,并在那里组合起来创建了一个本体。
对于实时文档处理,文档从内容管理系统发送到
机器标签服务,该服务重新处理文档、分配标签并将
关键词和短语添加到 Neo4j 数据库中,同时将文档返回到
文档存储库。
能够为历史数据——并实时——分配元数据,解决了思科的内容
查找问题。
但 Neo4j 更进了一步。
根据关键词、内容评分以及文档被访问的次数,
Neo4j 也能够提供内容推荐,为销售人员提供
额外的信息,供他们在与客户敲定交易时加以利用。