的步骤如下:
install.packages("rvest")
library(rvest)
url <- "http://example.com/page1"
page1 <- read_html(url)
url <- "http://example.com/page2"
page2 <- read_html(url)
titles1 <- page1 %>% html_nodes("h1") %>% html_text()
titles2 <- page2 %>% html_nodes("h1") %>% html_text()
titles <- map2(titles1, titles2, c)
这是一个使用rvest和map函数将使用相同url的两个单独的网页抓取合并为一个抓取的基本步骤。具体的实现方式可能因具体情况而有所不同。
领取专属 10元无门槛券
手把手带您无忧上云