加载 HTML
从 Html 页面抓取数据。
|
加载 Html 页面并将其结果作为 Map 返回 |
此过程提供了一个非常方便的 API,用于使用 DOM、CSS 和类似 jquery 的方法进行操作。它依赖于jsoup 库。
CALL apoc.load.html(url, {name: <css/dom query>, name2: <css/dom query>}, {config}) YIELD value
结果是 DOM 元素流,由一个映射表示
结果是一个映射,即
{name: <list of elements>, name2: <list of elements>}
配置
Config 参数是可选的,默认值为一个空映射。
|
默认值:UTF-8 |
|
默认值:"",用于解析相对路径 |
|
默认值:false,使用 HTML 字符串而不是 url 作为第一个参数 |
真实数据示例
下面的示例使用维基百科主页。
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"})
您将获得以下结果

CALL apoc.load.html("https://en.wikipedia.org/",{links:"link"})
您将获得以下结果

CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"}, {charset: "UTF-8"})
您将获得以下结果
