加载 HTML

从 Html 页面抓取数据。

apoc.load.html('url',{name: jquery, name2: jquery}, config) YIELD value

加载 Html 页面并将其结果作为 Map 返回

此过程提供了一个非常方便的 API,用于使用 DOM、CSS 和类似 jquery 的方法进行操作。它依赖于jsoup 库

CALL apoc.load.html(url, {name: <css/dom query>, name2: <css/dom query>}, {config}) YIELD value

结果是 DOM 元素流,由一个映射表示

结果是一个映射,即

{name: <list of elements>, name2: <list of elements>}

配置

Config 参数是可选的,默认值为一个空映射。

字符集

默认值:UTF-8

基本 URI

默认值:"",用于解析相对路径

HTML 字符串

默认值:false,使用 HTML 字符串而不是 url 作为第一个参数

真实数据示例

下面的示例使用维基百科主页

CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"})

您将获得以下结果

apoc.load.htmlall
CALL apoc.load.html("https://en.wikipedia.org/",{links:"link"})

您将获得以下结果

apoc.load.htmllinks
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"}, {charset: "UTF-8"})

您将获得以下结果

apoc.load.htmlconfig