腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
purrr
包
的
map
函数
没有
抓取
所
有的
urls
数据
?
、
、
、
、
我试图从一个网站上刮下一些艺术家
的
歌词,以便稍后由艺术家来做一些词云。
urls
是使用
purrr
map
函数
生成
的
,以从其中
抓取
每个歌词。代码会运行,但过了一段时间后只会返回一个艺术家
的
歌词。我需要做什么来
抓取
所
有的
歌词并将它们存储在一个对象中?---LIBRARIES---------------------------------------------- library(strin
浏览 12
提问于2019-12-05
得票数 0
回答已采纳
1
回答
将
函数
映射到使用rvest
的
刮掉
的
链接列表时出错
、
、
、
我正在尝试应用一个
函数
,从刮掉
的
链接列表中提取一个表。我正处于将get_injury_data
函数
应用于链接
的
最后阶段--我在成功执行这一功能时遇到了问题。then unnest the list of lists as a long list mutate(links =
map
player_injury_links list create a dataset by web scrapping the play
浏览 0
提问于2021-03-11
得票数 0
回答已采纳
1
回答
R rvest错误:“doc_namespaces(文档)错误:外部指针无效”
、
、
、
、
我
的
问题类似于this one,但后者
没有
收到我可以处理
的
答案。我正在用xml2::read_html
抓取
数以千计
的
urls
。这可以很好地工作。但是,当我尝试使用
purrr
::
map
_df和html_nodes解析生成
的
html文档时,我得到了以下错误: Error in doc_namespaces(doc) : external pointer但如果有人能从概念上向我解释这个错误
的
含义以及如何解决它,那就太好了(
浏览 166
提问于2019-05-23
得票数 2
回答已采纳
2
回答
使用r中
的
for循环进行批处理http状态代码测试中
的
错误
、
、
、
我有一个独特
的
df ids x
urls
。httpstatus[i] <- http_status(resp)$reason我想(a)为每个url查找status_code,(b)为每个url查找http_status,(c)将它们排到同一个df中
的
新列中问题: 1.在下面的代码中,当我将i替换为实际
的
索引号(例如i= 1)时,代码工作正常。curl_fetch_memory(url, handle = handle) : 如何使http
浏览 1
提问于2017-08-02
得票数 0
回答已采纳
1
回答
对带
map
()
的
子组应用test (Jarque)
、
、
、
我试图在
数据
集
的
子组上运行一个测试(Jarque)。为此,我试图使用
purrr
的
函数
map
(),但不知怎么
的
,它对我来说失败了。对于这里
的
示例,我将使用内置
的
ChickWeight
数据
集:library(dplyr)library(tidyr)libraryX-squared = 46.687, d
浏览 1
提问于2018-06-01
得票数 0
回答已采纳
1
回答
R:使用rvest和
purrr
:
map
_df构建一个
数据
框架:如何处理不完全输入
、
、
我正在用rvest在网页上
抓取
网页,并使用
purrr
::
map
_df将收集到
的
数据
转化为
数据
。我遇到
的
问题是,并不是所
有的
网页都有我指定
的
每个html_nodes上
的
内容,而
map
_df忽略了这些不完整
的
网页。我希望
map
_df包含上述网页,并在NA与内容不匹配
的
地方编写html_nodes。请使用以下代码:lib
浏览 1
提问于2019-05-02
得票数 1
回答已采纳
2
回答
如何使代码每5分钟运行一次?
我想运行我
的
代码,这是一个网络
抓取
代码,为我获取新闻标题,在R中每5分钟我搜索一些类似的问题,但我
没有
找到任何问题。我正在考虑声明一个变量并创建一个循环,但是它
没有
对我起作用,因为代码会运行什么.每秒100次或者其他类似的。它起作用,但不是它应该采取
的
方式。我只是不知道如何使它按顺时针方向工作。比如,当系统上
的
时间达到20:05时,它运行代码。下一轮应该是20:10,以此类推。
浏览 12
提问于2021-08-11
得票数 0
1
回答
在R中使用Rvest和Glue
包
进行
抓取
、
、
、
我正在尝试使用rvest和glue
包
抓取
多页体育
数据
。我在嵌套方面遇到了问题,我想这是因为网站上
的
表格有一个两行
的
标题(有些标题是一行,有些是两行)。这是我开始编写
的
代码。17和位置1:4
的
函数
:read_ht
浏览 32
提问于2020-02-15
得票数 0
1
回答
在
purrr
::中使用
函数
参数,否则
、
、
有
没有
办法使用传递给otherwise参数
purrr
::possibly()中
的
原始
函数
的
参数?例如(这是一个愚蠢
的
玩具示例-真正
的
代码涉及到一个受密码保护
的
门户后面的web
抓取
):library(
purrr
) # ideally, something l
浏览 5
提问于2019-09-24
得票数 4
回答已采纳
1
回答
Web
抓取
著名
的
名字
、
我在试着 这里有一个,这样观众就可以看到单个页面。我试图模拟我
的
R代码后
的
,但这是困难
的
,因为在个别网站上
没有
标题
的
性别,例如。有人能帮忙吗?library(
purrr
)url_base <- "https://www.nndb.com/lists/494/000063305
浏览 1
提问于2019-04-01
得票数 0
回答已采纳
2
回答
跨多个页面的Web
抓取
R
、
其目的是收集50页网站中某部分单词
的
平均词长和其他统计
数据
。收集统计
数据
是
没有
问题
的
,这是一个简单
的
部分。然而,让我
的
代码收集超过50个页面的统计
数据
是困难
的
部分,它似乎只从第一个页面输出信息。请看下面的代码,忽略糟糕
的
缩进。funnest_tokens(word, text) textSort.tidy %>%
浏览 29
提问于2021-07-23
得票数 0
1
回答
使用getURIAsynchronous()
抓取
多个网页
、
、
我是R中
的
新手,我正在尝试使用getURIAsynchronous()
函数
从RCurl
包
中刮取多个https网页。但是,对于每个url,该
函数
作为结果返回"“。我尝试使用来自同一个
包
的
url.exists()
函数
来查看它是返回TRUE还是FALSE。令我惊讶
的
是,它将值返回为FALSE。但网址是存在
的
。由于我使用
的
这些https
urls
是我
的
公司特定
的
浏览 2
提问于2017-10-08
得票数 1
回答已采纳
2
回答
从R中
的
多个API导入和提取
数据
、
、
fromJSON("https://hello.com/users/0/bets") 我从每个API获得一个
数据
框架:a1 <- df1 使用来自bind_rows库
的
dplyr,我将两个
数据
帧合并为一个单独
的
数据
帧(我也可以
浏览 1
提问于2018-08-09
得票数 0
回答已采纳
2
回答
即使存在错误,如何尝试调用重命名并返回结果?
我想迭代一个
数据
帧列表,一个重命名
函数
。有时DFs将为空。lookup[i1])现在,将该
函数
用于:如何将我
的
函数
应用到多个<e
浏览 3
提问于2020-12-09
得票数 1
回答已采纳
1
回答
R:如何将地图(Read_html)用于多个URL?
、
、
工作代码:title <-示例
数据
:art
浏览 4
提问于2021-10-29
得票数 1
3
回答
提取模型摘要并将其存储为新列
、
、
、
、
我对
purrr
范式并不熟悉,并且正在与它作斗争。library(
purrr
)library(tidyr) nest(-cyl) %>% rsq =
map</
浏览 6
提问于2016-12-02
得票数 7
回答已采纳
2
回答
将许多html表读入R中
、
、
我试图将html
数据
表拉到一个
数据
框架中,我正在寻找一个优雅
的
解决方案。有255个表,
urls
由两个变量变化:年份和Aldermanic区。我知道一定有办法用来做循环什么
的
,但我很困惑。通过使用单独
的
代码行读取每个表,我已经成功地导入了
数据
,但是这会为每个表生成一行,而且还有255个表。assessments.milwaukee.gov/SalesData/2015_RVS_Dist14.htm", skip.rows=1), 理想情况下,
浏览 2
提问于2019-03-24
得票数 0
回答已采纳
1
回答
在r
数据
库中从
抓取
的
字符串转换整数
、
、
、
我正在努力寻找一种方法,将既有数字又有字母
的
字符串转换为R中
的
数字。我从web上
抓取
了
数据
,现在想要将字符串中
的
一列转换为数字。我
的
df,Clean.data$Drafted..tm.rnd.yr
的
最后一列现在是这样
的
:"Arizona /1/5 pick / 2011“。有
没有
办法做到这一点?我是R
的
新手。library(rvest)li
浏览 5
提问于2020-11-14
得票数 1
回答已采纳
2
回答
在不使用for循环
的
情况下从R中
数据
框中
的
列创建文本文件
、
、
我正在尝试使用dplyr和
purrr
包
中
的
和
map
函数
从
数据
框中
的
列创建单独
的
文本文件,这样我就不必创建for循环,并且可以使用现
有的
列名作为新txt文件
的
文件名。以下是
数据
帧:s = c("aa", "bb", "cc") df = data.fram
浏览 3
提问于2016-09-14
得票数 0
2
回答
很难将从单个列
抓取
的
数据
转换为正确
的
表格式
、
、
我正在尝试从rotoguru1.com上获取与梦幻足球运动员薪水相关
的
数据
。我正在尝试收集
数据
的
示例网页可以在这里找到:。在每个页面上
的
html "pre“标签下可以方便地获得scsv格式
的
数据
。我首先使用for循环来生成我想要从其中
抓取
数据
的
所有
urls
,但随后我努力将这些网页中
的
所有
数据
转换成我想要
的
格式,一个包含所有
抓取<
浏览 21
提问于2021-02-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R for data science之purrr包(上)
Hadley Wickham 采访节选(二)
Hadley Wickham 采访节选(一)
grequests,一个神奇的 Python 库!
爬虫之scrapy框架
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券