我目前正在尝试从Nrl Fantasy Stats网站(https://fantasy.nrl.com/stats-centre)上抓取数据,但无法深入到表和行中,也无法提取任何数据。为了清楚起见,我正在尝试从网站上的表格中提取体育运动员的数据,比如姓名,位置,平均幻想点数等。 与我交谈过的人说,我应该进入开发者工具>网络,然后过滤XHR来做这件事。我还试图访问HTML</
假设我有一个有文章的新闻网站,我有一个空白的文章页面,除了标题、照片和文本文章本身,我通常会手动填写。而不是填充它,假设我已经从网页上抓取了整个div类。我想让我已经知道如何构建的网络刮板再走一步,在我的空白页面网站上对某个div类进行查找和替换,而不是将数据写到我计算机硬盘上的文件中(尽管也许用Python在我的硬盘上写入数据,然后让JS或其他东西读取我硬盘上的HTML文件,然后将其写入到我的网页上将是一种方法。copy as outerHTML>”并在文本编辑
我感兴趣的是提取篮球-reference.com上的球员表。我已经成功地提取了特定玩家的每个游戏的统计表(例如,LeBron James ),这是网页上列出的第一个表。但是,页面上有一些我似乎无法提取的10+表。我已经能够以几种不同的方式将表放入R中。首先,使用rvest包:lebron <- "https://www.basketball-reference.com/players/j/jamesle01.html"