Neo4j 存储配置

此对象用于配置 Neo4j 存储以连接到您的 Neo4j 实例并管理三元组存储的解析。

构造函数

名称

类型

必需

值(默认值)

描述

auth_data

字典

是,除非在存储初始化中传递了驱动程序对象

("uri", "database", "user", "pwd")

包含身份验证数据的字典。必需的键为:["uri", "database", "user", "pwd"]。

batching

布尔值

False

布尔值 (True)

指示是否启用批处理的布尔值。

batch_size

整数

False

(5000)

表示批处理大小的整数(批处理大小旨在作为数据库中要存储的实体数量(节点/关系),而不是三元组)。

custom_mappings

List[Tuple[Str,Str,Str]]

False

空列表

包含前缀自定义映射的元组列表,格式为 (prefix, object_to_replace, new_object)。

custom_prefixes

字典

True ①

({})

包含自定义前缀的字典。

handle_vocab_uri_strategy

HANDLE_VOCAB_URI_STRATEGY

False

IGNORE, KEEP, MAP, (SHORTEN)

* 'SHORTEN',使用前缀缩短属性名称、关系名称和标签的完整 URI。如果导入的 RDF 中未预定义命名空间的前缀,则会失败。

* 'IGNORE',忽略 URI,仅保留本地名称。

* 'MAP',在导入时应用词汇表元素映射。

* 'KEEP',保持 URI 不变。

handle_multival_strategy

HANDLE_MULTIVAL_STRATEGY

False

ARRAY (OVERWRITE)

* 'OVERWRITE',属性值保持单值。导入的 RDF 中的多个值将被覆盖(仅保留最后一个)。

* 'ARRAY',属性存储在数组中,允许存储多个值。除非设置了 multivalPropList,否则所有值都会被存储。

multival_props_names

List[Tuple[Str,Str]]

False

([])

包含要作为多值处理的前缀和属性名称的元组列表,格式为 (prefix, property_name)。

① 如果 handle_vocab_uri_strategy == HANDLE_VOCAB_URI_STRATEGY.SHORTEN

函数

set_handle_vocab_uri_strategy

设置处理词汇表 URI 的策略。

参数

名称

类型

描述

val

HANDLE_VOCAB_URI_STRATEGY

要设置的 handle_vocab_uri_strategy 值。

set_handle_multival_strategy

设置处理多个值的策略。

参数

名称

类型

描述

val

HANDLE_MULTIVAL_STRATEGY

要设置的 handle_multival_strategy 值。

set_default_prefix

设置默认前缀。

参数

名称

类型

描述

name

str

前缀的名称。

value

str

前缀的值(命名空间 URI)。

set_multival_prop_name

设置要作为多值处理的属性名称。

参数

名称

类型

描述

prefix_name

str

前缀的名称。

prop_name

str

要作为多值处理的属性的名称。

set_custom_prefix

向配置中添加自定义前缀。

参数

名称

类型

描述

name

str

前缀的名称。

value

str

前缀的值(命名空间 URI)。

delete_custom_prefix

从“custom_prefixes”字典中删除自定义前缀。

参数

名称

类型

描述

name

str

要删除的自定义前缀的名称。

set_custom_mapping

为某个前缀添加自定义映射。

参数

名称

类型

描述

prefix_name

str

要映射的前缀的名称。

to_replace

str

要在命名空间 URI 中替换的值。

new_value

str

映射的新值(命名空间 URI)。

delete_custom_mapping

从 custom_mappings 字典中删除自定义映射。如果在可用的前缀中找不到前缀,则会引发 PrefixNotFoundException。

参数

名称

类型

描述

prefix_name

str

与“to_replace”关联的前缀的名称。

to_replace

str

要在前缀的命名空间内替换的值。

set_auth_data

设置身份验证数据。

参数

名称

类型

描述

auth

字典

包含身份验证数据的字典。必需的键为 ["uri", "database", "user", "pwd"]。

set_batching

设置批处理。

参数

名称

类型

描述

val

bool

指示是否启用批处理的布尔值。

set_batch_size

设置批处理大小。

参数

名称

类型

描述

val

int

表示批处理大小的整数。

get_config_dict

获取配置字典。如果缺少任何必需的身份验证字段,则会引发 WrongAuthenticationException。

参数

无参数。

输出

类型

描述

字典

包含配置参数的字典。

get_prefixes

获取包含所有前缀(默认和自定义)的字典。

参数

无参数

输出

类型

描述

字典

包含所有前缀的字典。

枚举值

HANDLE_VOCAB_URI_STRATEGY

定义处理词汇表 URI 的不同策略的枚举类。

可能的值

名称

描述

SHORTEN

缩短 URI 的策略(您将使用的每个前缀都必须在配置中定义,否则 Neo4jStore 将抛出 ShortenStrictException 错误)。

MAP

使用提供的映射映射 URI 的策略。

KEEP

保留 URI 的策略。

IGNORE

忽略命名空间并仅获取本地部分的策略。

缩短

此策略将缩短 URI,用其缩短版本替换前缀。如果 Store 发现其 Neo4jStoreConfig 对象中未定义前缀,则解析将停止,并引发 ShortenStrictException 错误。

映射

在导入时应用词汇表元素映射。

保留

此策略将按原样保留谓词,并保留其前缀。

忽略

此策略将从谓词中删除整个前缀。

HANDLE_MULTIVAL_STRATEGY

定义处理多个值的不同策略的枚举类。

如果策略为 ARRAY 且 Neo4jStoreConfig 不包含任何标记为多值的谓词,则每个字段都将被视为多值。

可能的值

名称

描述

OVERWRITE

覆盖多个值的策略。

ARRAY

将多个值视为数组的策略。

覆盖

此策略将覆盖节点的当前值。

映射

此策略将为同一主体在摄取过程中遇到的所有值连接到数组中。