加载 HTML

从 Html 页面抓取数据。

apoc.load.html('url',{name: jquery, name2: jquery}, config) YIELD value

加载 Html 页面并以 Map 形式返回结果

此过程提供了一个非常方便的 API,可以使用 DOM、CSS 和类似 jquery 的方法进行操作。它依赖于 jsoup 库

CALL apoc.load.html(url, {name: <css/dom query>, name2: <css/dom query>}, {config}) YIELD value

结果是表示为 Map 的 DOM 元素流

结果是一个 Map,即

{name: <list of elements>, name2: <list of elements>}

配置

Config 参数是可选的,默认值是一个空 Map。

charset

默认值:UTF-8

baserUri

默认值:"",用于解析相对路径

htmlString

默认值:false,表示使用 HTML 字符串作为第一个参数,而不是 URL

真实数据示例

以下示例使用 Wikipedia 主页

CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"})

您将获得此结果

apoc.load.htmlall
CALL apoc.load.html("https://en.wikipedia.org/",{links:"link"})

您将获得此结果

apoc.load.htmllinks
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"}, {charset: "UTF-8"})

您将获得此结果

apoc.load.htmlconfig
© . All rights reserved.