文档的实时图分析为公司节省超过400万员工工时

挑战

由于思科销售渠道的广度，存在大量内容，例如
文档、文件和演示文稿——在思科销售团队所依赖的内部数据库中。
以签下潜在客户。

然而，存在一个严重的内容查找问题：每位销售人员每天花费高达一小时
试图找到与其潜在客户需求相关的内容。

该公司此前依赖于一个典型的索引驱动搜索引擎，员工可以通过
一系列关键词进行搜索。但是，由于文件没有被分配元数据，因此难以
查找相关内容。

思科内容服务总监 Prem Malhotra 表示：“问题在于内容太多，并且对内容缺乏更深入的理解。”
思科内容服务总监 Prem Malhotra 表示：“我们必须自问，‘我们如何才能
让搜索引擎表现得更好，以及缺少了什么关键环节？’”

思科转向 Neo4j 来解决这些挑战。

为了给思科大量的历史文档分配元数据，第一步是
将文件类型——例如 Microsoft Word 和 PDF——转换为潜在狄利克雷
分配 (LDA) 格式，以便文档可以被大型数据平台进行聚类。

文档聚类完成后，一组常用关键词和短语被输入到
Neo4j 中，并在那里组合起来创建了一个本体。

对于实时文档处理，文档从内容管理系统发送到
机器标签服务，该服务重新处理文档、分配标签并将
关键词和短语添加到 Neo4j 数据库中，同时将文档返回到
文档存储库。

能够为历史数据——并实时——分配元数据，解决了思科的内容
查找问题。

但 Neo4j 更进了一步。

根据关键词、内容评分以及文档被访问的次数，
Neo4j 也能够提供内容推荐，为销售人员提供
额外的信息，供他们在与客户敲定交易时加以利用。