加载 HTML
从 Html 页面抓取数据。
|
加载 Html 页面并以 Map 形式返回结果 |
此过程提供了一个非常方便的 API,可以使用 DOM、CSS 和类似 jquery 的方法进行操作。它依赖于 jsoup 库。
CALL apoc.load.html(url, {name: <css/dom query>, name2: <css/dom query>}, {config}) YIELD value
结果是表示为 Map 的 DOM 元素流
结果是一个 Map,即
{name: <list of elements>, name2: <list of elements>}
配置
Config 参数是可选的,默认值是一个空 Map。
|
默认值:UTF-8 |
|
默认值:"",用于解析相对路径 |
|
默认值:false,表示使用 HTML 字符串作为第一个参数,而不是 URL |
真实数据示例
以下示例使用 Wikipedia 主页。
CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"})
您将获得此结果

CALL apoc.load.html("https://en.wikipedia.org/",{links:"link"})
您将获得此结果

CALL apoc.load.html("https://en.wikipedia.org/",{metadata:"meta", h2:"h2"}, {charset: "UTF-8"})
您将获得此结果
