我想从网站上抓取官方法律(这是一个)。这些文档可以在html网站的菜单中访问。我设法从网站,如github和下载PDF链接,但我有困难从这种类型的网站提取。我尝试了以下代码:
library(rvest)
# read html
page <- read_html("https://bl.clex.ch/app/de/texts_of_law/780")
# from nodes I would like to get the links where the PDFs are stored
raw_list <- page %>% # takes t
我读过,每个html网站都可以保存为PDF格式。
这正是我所需要的。我需要创建一个“下载到PDF”按钮,保存当前的网站PDF。
观看该网站的代码,明白要将网站保存为pdf,我需要使用javascript构建网站中的每个元素?
我不能简单地将"/ticket.html“作为PDF保存吗?
function createPDFLink(fileName) {
var doc = new pdf();
// whatever content you want to download
var a = document.createElement("a")