自然语言处理 (NLP)

本章介绍的过程充当基于云的自然语言 API 的包装器。这些过程从存储为节点属性的文本中提取实体、关键词、类别和情感。

本节包括

Neo4j 为结构化数据提供了强大的查询功能,但世界上许多数据都存在于文本文档中。NLP 技术可以帮助提取这些文档中的潜在结构。这种结构可以像表示句子中词元的节点一样简单,也可以像使用命名实体识别算法提取的表示实体的节点一样复杂。

为什么选择 NLP?

从文本文档中提取结构并将其存储在图中可以实现多种不同的用例,包括

  • 基于内容的推荐

  • 自然语言搜索

  • 文档相似性

apoc.nlp.* 过程

它包含调用 Amazon Web Services (AWS)、Google Cloud Platform (GCP) 和 Microsoft Azure 自然语言 API 的过程,并根据返回的结果创建图。

这些过程支持实体提取、关键词提取、情感分析和文档分类。

开发者指南

以下指南展示了如何解决各种与 NLP 相关的問題

其他方法

为了完整起见,我们报告了其他可能的 NLP 方法。

Hume 是由 Neo4j 合作伙伴 GraphAware 创建的基于图的洞察引擎。它可以用来构建知识图,帮助您的组织发现以前被掩盖和未被发现的相关性。

以下文章介绍了其他使用 Python 库和 Cypher 进行 NLP 分析的方法