更新日志

此页面包含适用于 Snowflake 的 Neo4j 图分析的原始更新日志。

更新日志

1.0.5

新增

  • 改进了作业配置的预先验证,确保:

  • 项目和写入配置包含所有强制参数

  • 默认表前缀有效

  • 所有规范化的表名都有效

  • 提供的节点表和关系表存在且可访问

  • 提供的节点表和关系表符合预期模式

  • 源表和目标表作为 nodeTables 提供

  • 改进了作业配置验证的错误报告

变更

  • graph.dijkstragraph.dijkstra_single_source 现在还返回路径的节点 ID 和成本。

  • 移除 experimental.dijkstra,转而使用 graph.dijkstra

修复

  • 修复了 graph.fastpath 中的一个错误,即提供 firstRelationshipType 总是导致配置验证失败,即使该类型有效。

  • 修复了一个导入缺失导致某些端点出现问题,在作业配置验证失败时出现令人困惑的错误消息的错误。

1.0.4

新增

  • 添加了实验性端点 experimental.dijkstra,用于运行 Dijkstra 算法并返回所有路径作为结果的一部分。

  • 添加了对作业配置某些方面的预先验证,如果配置无效,则使作业快速失败。

变更

修复

1.0.3

新增

  • 添加了 DegreeCentrality 算法和过程 graph.degree

变更

修复

1.0.2

新增

  • 添加了支持将 defaultTablePrefix 设置为算法配置中的全局设置。

变更

修复

1.0.1

新增

变更

修复

1.0.0

新增

变更

修复

0.3.14

新增

  • 添加了 admin.show_jobs 过程,用于列出系统中所有已完成的作业。

  • 添加了 TriangleCounting 算法和过程 graph.triangle_count

变更

  • admin.get_max_nodes 替换 internal.get_max_nodes

  • admin.set_max_nodes 替换 internal.set_max_nodes

  • admin.get_min_nodes 替换 internal.get_min_nodes

  • admin.set_min_nodes 替换 internal.set_min_nodes

  • graph.job_log 替换 internal.job_service_log

修复

  • 通过将日志级别更改为 DEBUG,暂时恢复了因转向运行瞬态作业服务而丢失的诊断信息。

0.3.13

新增

变更

修复

  • 修复了 Dijkstra 和 Page Rank 中结果配置条目可能显示内部节点 ID 的问题。

  • 解决了 SPCS 事件共享中的限制。

0.3.12

新增

  • 过程 internal.get_min_nodesinternal.get_max_nodesinternal.set_min_nodesinternal.set_max_nodes,用于管理计算池中的节点数量。

  • 日志端点 internal.job_service_log 在基于 Python 的算法失败时包含堆栈跟踪。

变更

  • 对于 graphsage 和 fastpath 算法,将 API 语法(例如顶级键和驼峰式参数)与所有其他算法保持一致。

修复

  • 修复了 graph.gs_nc_traingraph.gs_nc_predictgraph.gs_unsup_traingraph.gs_unsup_predict 中 GPU 未被利用的错误。

0.3.11

新增

变更

修复

0.3.10

新增

  • 添加了过程:graph.betweenness graph.dijkstra graph.dijkstra_single_source graph.drop_model graph.fastpath graph.fast_rp graph.graph graph.gs_nc_predict graph.gs_nc_train graph.gs_unsup_predict graph.gs_unsup_train graph.knn graph.louvain graph.model_exists graph.node_similarity graph.page_rank graph.show_available_compute_pools graph.show_models graph.wcc

变更

修复

0.3.9

新增

变更

修复

  • 恢复了可用计算池中损坏的数据。

0.3.8

新增

  • 支持 GPU 计算池 GPU_NV_XS,在大多数 Azure 区域可用。

  • gml.show_available_compute_pools 和 gds.show_available_compute_pools。这些是 gml.list_available_compute_pools 和 gds.list_available_compute_pools 过程的替代品,后者将在未来的版本中移除。

变更

修复

  • 当特定区域中计算池实例系列不可用时,计算池和仓库创建不再失败。

0.3.7

新增

  • gds.graph_project 中支持 defaultTablePrefix,为主映的所有表启用一个通用前缀。

  • 授予 APP_ADMIN 角色对应用程序管理计算池的 OPERATE 权限。

变更

  • gds.graph_project 中将映射替换为表或视图列表 nodeTables。现在从表名推断相应的标签。这是一个破坏性更改。

  • gds.graph_projectrelationshipTables 的列表条目中移除了 type 参数。现在从表名推断关系类型。

修复

  • 修复了一个错误,即当投影涉及多个节点表时,write_relationships 可能会写入错误的节点 ID。

0.3.6

新增

变更

修复

0.3.5

新增

  • 支持从多个节点和关系表投影异构图。

    • 这是一个破坏性更改,因为以下语法发生了变化:

    • gds.graph_project

    • gds.write_nodeproperties

    • gds.write_relationships

    • 包含节点引用(例如路径算法)的算法配置。

  • 支持输入表中表唯一的非整数节点标识符。

    • 现在支持 VARCHARBIGINT 节点标识符。

    • 节点标识符只需在其投影自的表中保持唯一。

变更

修复

0.3.4

新增

  • 过程 gds.list_available_compute_pools,用于列出可用于 GDS Session 的计算池。

  • 过程 gml.list_available_compute_pools,用于列出可用于 GML Session 的计算池。

  • 新的机器学习算法 FastPath gml.fastpath,用于计算路径嵌入。

  • 添加了管理模型的端点

    • 检查模型是否存在:gml.model_exists

    • 列出模型:gml.model_list

    • 删除模型:gml.model_drop

变更

  • 如果使用无效的计算池选择器,则抛出异常,并带有清晰的消息和有效计算池选择器列表。

  • 遥测事件共享变更。

    • 错误和警告 ⇒ 强制

    • 跟踪 ⇒ 强制

    • 使用日志 ⇒ 强制

    • 调试日志 ⇒ 可选

    • 指标 ⇒ 可选

修复

0.3.3

新增

变更

修复

  • Snowflake 最近的更改要求 GPU 计算池的使用必须在应用程序清单中预先声明,否则计算池创建将失败。

0.3.2

新增

变更

  • 精简 GraphSAGE 端点的返回值

  • 改进了 GraphSAGE 的日志记录

  • 如果模型名称已存在,则在任何 gml 训练算法(目前是 GraphSAGE)中提前失败

  • 在 gml 训练和预测算法失败时,将失败原因添加到日志表

修复

  • 修复了导致 GraphSAGE 记录进度超过 100% 的错误。

0.3.1

新增

变更

修复

  • 修复了 GraphSAGE 可能耗尽共享内存的问题。

  • gml.gs_nc_predict 的配置中移除了 target_label,因为它未被使用。

0.3.0

新增

  • graph_project 现在支持将节点标识符列投影为 BIGINTVARCHAR

    • 这允许更灵活的节点标识符列,例如在使用 UUID 时。

    • 对于 BIGINT,投影运行时将有约 2 倍的性能退化,这将在即将发布的版本中解决。

  • 图机器学习运行时。

    • gml.create_session

    • gml.stop_session

    • gml.list

  • 有监督 GraphSAGE

    • gml.gs_nc_train

    • gml.gs_nc_predict

  • 无监督 GraphSAGE

    • gml.gs_unsup_train

    • gml.gs_unsup_predict

  • 支持 GPU 计算池 GPU_NV_S。

变更

修复

0.2.19

新增

  • graph_list 显示内存图的堆内存使用情况。

  • 添加了对计算池类型 HIGHMEM_X64_L 的支持。

变更

  • 不再允许从空节点表进行投影,并将返回错误。

修复

  • 无效的函数参数现在会返回更好的错误消息,不再是服务器错误。

    • 这修复了长时间运行的查询最终会因服务器错误而失败的问题。

0.2.18

新增

  • 添加了对 gds.drop_nodeproperties 的支持,用于从图中删除节点属性。

变更

  • 改进了服务日志记录。

    • 分离了服务器层(snowgraph)和应用程序层(gds)的日志记录。

    • 添加了更详细的端点执行日志记录。

    • 允许通过 internal.set_log_level(logger, level) 函数设置日志级别。

修复

0.2.17

新增

变更

修复

  • 修复了删除图时,如果图不存在,可能会长时间停滞的错误。

  • 在回写时禁用提前失败,因为创建表的权限检查不稳定。

0.2.16

新增

  • 通过命令 gds.hits 添加了对 HITS 算法的支持。

  • 添加了对 gds.graph_filter 的支持,用于根据节点和关系属性过滤子图。

变更

  • 并发现在默认为核心数。影响“concurrency”、“readConcurrency”和“writeConcurrency”。

修复

0.2.15

新增

变更

修复

0.2.14

新增

变更

修复

0.2.13

新增

  • 通过命令 gds.sllpa 添加了对 Speaker-Listener 标签传播算法的支持。

变更

  • 应用程序创建五个自己的计算池,消费者从中选择一个运行。

  • 应用程序创建自己的查询仓库,消费者根据自己的需求进行配置。

  • 应用程序需要 CREATE COMPUTE POOL 和 CREATE WAREHOUSE 权限的授权。

修复

  • 各种文档修复。

0.2.12

新增

变更

  • gds.indirect_exposure 现在为每个节点计算 exposurehopparentroot

    • 这可以在配置中通过 'mutateProperties': { 'exposure': '<key>', 'hop': '<key>', 'parent': '<key>', 'root': '<key>' } 定义。

    • 该算法目前仅支持 max 聚合,exposureReducer 配置已被移除。

修复

0.2.11

新增

变更

修复

0.2.10

新增

  • gds.indirect_exposure 允许指定 exposureReducer 函数来聚合多个邻居的曝光度。

    • 默认的 exposureReducer 函数是 SUM,可能的值是 SUMMAX

变更

修复

0.2.9

新增

  • 添加了用于风险分析的 gds.indirect_exposure 算法。

  • 升级后,调用 gds.create_session 将显式删除并重新创建服务。

变更

修复

0.2.8

新增

  • 添加了对使用完整 BIGINT 范围的节点 ID 范围的支持。

修复

  • 修复了 GDS 服务 JVM 堆内存大小的问题。

0.2.7

新增

  • GDS 获取调用 Snowflake 用户的用户名

    • 按用户投影、列出和删除图

    • 在用户自己的图上运行算法

  • GDS 获取调用 Snowflake 用户的当前角色

    • 如果当前角色具有应用程序角色 APP_ADMIN,则设置管理员权限

  • 支持节点属性投影的半结构化 ARRAY 类型。元素类型可以是 BIGINTDOUBLE

  • gds.write_nodeproperties_to_tablegds.write_relationships_to_table

    • 这两个函数都将数据上传到应用程序内部暂存区,然后将数据复制到指定的消费者表中。

  • gds.write_nodeproperties_to_stagegds.write_relationships_to_stage

    • 这两个函数都将数据上传到消费者定义的暂存区以进行进一步处理。

  • gds.write_nodeproperties_to_table 支持写入半结构化 ARRAY 类型

    • 元素类型可以是 BIGINTDOUBLE

  • gds.graph_project 支持为关系设置 orientation

    • 可能的值是 NATURAL(默认)、UNDIRECTEDREVERSED

变更

  • 重命名为“Neo4j 图数据科学”(文本中长形式为“Neo4j 图数据科学 <版本>”)。

  • write_nodepropertieswrite_relationships 参数 outputTable 更改为 table

  • write_nodepropertieswrite_relationships 现在是别名

    • write_nodepropertieswrite_nodeproperties_to_table 的别名

    • write_relationshipswrite_relationships_to_table 的别名

  • GDS 操作结果(图投影、算法)的自动逐出

    • 结果可以通过 gds.result_listgds.result 函数访问。

    • 操作完成后,结果会保留 2 小时,然后被逐出。

0.2.6

变更

  • 使用 snowpark-sdk 进行模式操作。

0.2.5

修复

  • 确保关系属性在内存图中显示。

  • write_relationships 现在可以正确地将关系写入表。

0.2.4

变更

  • graph_projectwrite_nodepropertieswrite_relationships 使用 snowflake-jdbc 驱动而不是 snowpark-sdk。

© . All rights reserved.