腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
包含
NAs
的
Rvest
返回
表
、
、
、
我试图使用
Rvest
包从一个
表
中抓取数据,但
返回
的
表
中充满了
NAs
,除了第一行之外,所有数据都丢失了。 我怎么才能解决这个问题呢?
浏览 24
提问于2021-05-10
得票数 0
回答已采纳
1
回答
rvest
从网页抓取链接
、
我正在使用
rvest
从杂志“骗局”中抓取一些链接。我用过这段代码 library(
rvest
) html_nodes(".daily-article-title") %>% html_attr('href') 但是,这将
返回
30
nas
的
浏览 13
提问于2021-04-29
得票数 0
回答已采纳
2
回答
从web链接中抓取
表
、
、
、
我想从中提取Holdings
表
,我有以下代码: test_html = read_html(turl) 但是,在运行它时,我会得到以下错误: 矩阵中
的
错误(NA_character_,nrow = n,nrow = maxp):无效
的
“no”值(过大或NA),此外:警告消息: 1
浏览 3
提问于2017-11-22
得票数 2
1
回答
当某些片段可能不是html时,我如何使用
rvest
来解析html片段?
、
我
的
数据由一个字符串列表组成,其中
包含
bug
的
再现步骤。这些通常编码为html,但有时只是原始文本,有时是空
的
(NA)。我需要文本sans html。我正在尝试使用
rvest
来实现这一点,但我遇到了一些问题。我有这个函数,它将解析一行html并
返回
一个字符串:tf <- function(frag) {read_html(frag) %>% html_nodes("p") %如果我有
NAs
浏览 0
提问于2016-11-16
得票数 0
2
回答
表
的
标题行与html_table函数冲突
、
、
我正在尝试提取页面上
的
表
。然而,使用html_table和
rvest
,第一行文本是
表
的
一部分,显然是与html_table冲突
的
。我留下密码library(
rvest
) url<-"http://www.svs.cl/institucional/mercados/consulta.php=:除真/假需要
的</em
浏览 6
提问于2017-03-23
得票数 2
回答已采纳
2
回答
以"<=“开头
的
右下角单元格以逻辑NA形式
返回
表
的
网络抓取
、
我试图刮一个
包含
以"<=“开头
的
单元格
的
web
表
。此单元格(右下角单元格)作为逻辑NA
返回
。如果我将"<=“更改为">=",则不会出现问题。我在RStudio工作台上使用
rVest
1.02有这个问题,但在我
的
笔记本版运行
rVest
1.00
的
RStudio上没有问题。><=72.000</td> </
浏览 3
提问于2021-12-14
得票数 0
1
回答
从Javascript弹出窗口中使用R抓取数据
、
、
我想从这个站点上抓取名为" Constraints“
的
弹出窗口
的
内容: (单击左侧
的
Constraints链接后会显示弹出窗口)。我运行了这个R代码,但没有用。const_info未
返回
任何内容。= 4)
rvest
::html_session('https://dataviewer.pjm.com/dataviewe
浏览 0
提问于2018-02-28
得票数 1
1
回答
rvest
:为给定多个清单
的
空节点
返回
NAs
、
、
我是相当新
的
R(特别是使用它在网络抓取),所以任何帮助都是非常感谢
的
。我目前正在尝试挖掘一个
包含
多个票务列表
的
网页,并列出其中一些(比如视图受损或仅供儿童使用
的
票证)
的
其他详细信息。我希望提取此数据,为不
包含
这些详细信息
的
票务列表留下空白或
NAs
。 由于最初
的
网站需要使用RSelenium,所以我尝试以更简单
的
形式复制HTML。如果有任何信息丢失,请让我知道,我会尽力提供。到目前为止,我已经尝试采用
浏览 0
提问于2019-02-01
得票数 2
回答已采纳
1
回答
使用
rvest
包进行Web抓取不起作用
、
、
、
我正在尝试使用
rvest
获取一个
表
,但它无法识别数字,并使用
NAs
创建了两个额外
的
列 几个月前它起作用了,但显然他们对网站做了修改,现在它不能工作了。我不知道问题出在哪里。
浏览 3
提问于2021-09-03
得票数 0
1
回答
RVEST
-从
表
中提取文本.访问正确
表
的
问题
、
、
、
我想提取这个网页右上角
表
中
的
值: 不幸
的
是,如果我使用html_nodes(“特定值
的
Selectorgadgets结果”),就会收到链接顶部
的
表
的
值: (网页类似,如果单击顶部栏上
的
“Uhrzeit/Uhrzeit”,可以访问第二个页面和
表
,如果单击"Wetter“-->&q
浏览 1
提问于2021-04-05
得票数 0
回答已采纳
1
回答
Rvest
返回
空
表
、
、
我正在尝试使用以下代码来获取这个网站上
的
表格:: read_html() %>% html_table() 然而,
返回
的<
浏览 28
提问于2018-06-05
得票数 1
回答已采纳
2
回答
如何使用Rselenium读取html表格?
、
、
、
下面的代码就是这样做
的
。我没有提供url,因为我在一家需要vpn连接
的
公司中使用url:require(RSelenium)<td align="center"> Pct </td></tr> <&
浏览 49
提问于2015-04-29
得票数 12
回答已采纳
2
回答
openxlsx::loadWorkbook / saveWorkbook抛出错误并破坏工作表格式
、
- loadWorkbook(ReportFilePath) #ReportFilePath is a character variable containing path to the file该文件
包含
多
浏览 8
提问于2021-09-06
得票数 1
2
回答
在R和
rvest
中刮取多个链接
的
HTML
表
、
、
本文
包含
四个指向html-
表
的
链接,我想用
rvest
对这些
表
进行抓取。在css选择器
的
帮助下:第一张桌子可能是这样
的
:html_session("http://www.ajnr.org/content/30/7/1402"#T1 a") %>% html_tabl
浏览 4
提问于2015-02-25
得票数 10
回答已采纳
1
回答
如何从r中
的
页面中抓取所有链接
、
、
、
我想刮所有的部门链接从一个网站,但我不断得到
NAs
。有什么解决办法吗?library(
rvest
)get_links 通过调整上面的内容,我设法抓取了一个链接,但在检查元素时找不到所有其他链
浏览 8
提问于2022-09-11
得票数 1
回答已采纳
1
回答
使用
rvest
和html_nodes()和html_table()提取网站
表
、
library(
rvest
)html_nodes("[id=roster]") %>%data7 上面的代码
返回
"roster“
表
中
的
数据。但是,下面的代码不会
返回
"team_misc“<
浏览 17
提问于2017-03-01
得票数 0
回答已采纳
1
回答
从澳大利亚网球公开赛统计数据中提取数据
、
但是,当我使用时,我想使用
rvest
库从
rvest
中刮取数据,特别是
表
中
的
数据。read_html("https://ausopen.com/event-stats") %>% html_nodes("table") 它
返回
{xml_nodeset (0)},我将如何尝试修复这个问题
浏览 2
提问于2021-03-19
得票数 0
回答已采纳
1
回答
使用
rvest
返回
表
的
子表
、
、
、
我很难弄清楚为什么下面的代码没有
返回
xpath指定
的
信息。 我正在尝试选择在页面的“核心问题”部分中找到
的
计数数据。我想让它在第一个问题
的
表
上工作,然后将它扩展到对页面上
的
每个问题/
表
做同样
的
事情。不幸
的
是,我能让它拉下我感兴趣
的
那部分桌子。我想答案包括指定我感兴趣
的
< tr >节点
的
子节点,即多个< td >标记,但是我
的
尝试仍
浏览 4
提问于2015-06-25
得票数 2
回答已采纳
1
回答
是什么使桌面上
的
网页刮擦有时失败?
、
、
我正在使用包,并试图弄清楚为什么有时它不能刮掉那些看起来很像
表
的
对象。例如,考虑这样
的
脚本:url <- "http://bigcharts.marketwatch.com/quickchart/options.asp?/tbody') %>%population> population另一个例子是: re
浏览 0
提问于2019-07-16
得票数 1
回答已采纳
1
回答
使用R和httr发布表单
、
、
、
、
/shortselling/
的
csv链接中自动导出数据。我尝试了下面的代码,但没有成功,我不明白我
的
错误。library(httr)res <- POST("https://www.finanssivalvonta.fi/api/shortselling/datatable/current/export")# 500 我还尝试使用以下代码直接导出
表</e
浏览 15
提问于2019-01-04
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
智能企业物联网工具是否可以加快返回办公室的时间表
应用R语言在百度学术上爬虫
4G一些常用的外层信令
什么是神经网络架构搜索?
自动优化架构,这个算法能帮工程师设计神经网络
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券