自然语言处理 (NLP)

本章描述的过程是云端自然语言 API 的包装器。这些过程从存储为节点属性的文本中提取实体、关键短语、类别和情感。

本节包括

Neo4j 为结构化数据提供了强大的查询能力,但世界上大量数据存在于文本文档中。自然语言处理技术可以帮助提取这些文档中的潜在结构。这种结构可以简单到表示句子中 token 的节点,也可以复杂到表示使用命名实体识别算法提取的实体的节点。

为何使用 NLP?

从文本文档中提取结构并将其存储在图数据库中,可以实现多种不同的用例,包括

  • 基于内容的推荐

  • 自然语言搜索

  • 文档相似度

apoc.nlp.* 过程

它包含调用亚马逊网络服务 (AWS)、Google Cloud Platform (GCP) 和 Microsoft Azure 自然语言 API,并根据返回结果创建图的过程。

这些过程支持实体提取、关键短语提取、情感分析和文档分类。

开发者指南

以下指南展示了如何解决各种 NLP 相关问题

其他方法

为了完整起见,我们报告了其他可能的 NLP 方法。

Hume 是 GraphAware(Neo4j 的合作伙伴)开发的图驱动的 Insights Engine。它可以用于构建知识图谱,帮助发现组织中以前埋藏和未被检测到的相关性。

使用 Python 库和 Cypher 进行 NLP 分析的其他方法在以下文章中有所描述

© . All rights reserved.