腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
让
分
位数
与
summarise_at
和
group_by
一起
使用
(
dplyr
)
、
、
在
使用
dplyr
创建按变量级别组织的汇总统计表时,如果不重复列名,我就无法理解计算四
分
位数
的语法。也就是说,
使用
调用(如vars()
和
list() )可与其他函数(如mean()
和
median() )
一起
使用
,但不能与quantile()
一起
使用
搜索产生了过时的解决方案,因为它们
使用
了过时的调用,如do()
和
/或funs()。(Species) %&g
浏览 27
提问于2019-09-17
得票数 5
回答已采纳
3
回答
我可以在同时添加其他变量的同时对现有的变量
使用
summarise_at
吗?
、
然后,假设我想对一些现有变量进行求和:+
group_by
(cyl) %>% # A tibble8 45 173 8 0 2 46 49> mtcars %>% +
浏览 0
提问于2019-11-15
得票数 2
回答已采纳
3
回答
带na.rm的
dplyr
summarise_each
、
有没有一种方法可以指导
dplyr
在na.rm=TRUE中
使用
summarise_each?我想用summarise_each("mean")来表示变量的均值,但是我不知道
如何
指定它来忽略缺少的值。
浏览 66
提问于2014-09-10
得票数 70
回答已采纳
2
回答
使用
带有列索引的
dplyr
summarise_at
、
我注意到,当向
dplyr
::summarize_at提供列索引时,将确定要汇总的列,不包括分组列。我想知道这是否应该是这样的,因为根据这种设计,
使用
正确的列索引取决于汇总列是位于分组列之前还是之后。下面是一个例子:data("mtcars") mtcars %>%
group_by
(gear) %>%
summarise_at
(3:4, mean) ## A
浏览 6
提问于2017-08-25
得票数 24
回答已采纳
1
回答
地图参数在..。(.funs= funs(f1,f2),.)
、
我需要从一个数字向量中计算几个
分
位数
,并为此
使用
dplyr
::summarise。我现在拥有的是:library(rlang) group <- enquo(groupdata %>%
summarise_at
(vars(!!!data %>%
g
浏览 0
提问于2019-02-28
得票数 0
4
回答
使用
dplyr
(或其他)将包含列表的数据帧列拆分为多个列。
、
考虑下面的示例数据tmp <- mtcars %>% summarise(mpg_sum = list(summary(mpg))) 因此,mpg_sum包含mpg变量的最小、第一四
分
位数
、中值、平均值、第三四
分
位数
和
最大值(按组划分)。
如何
用
dplyr
将该列解压缩为6列,并
使用
dplyr
或其他方式
浏览 4
提问于2016-07-04
得票数 8
回答已采纳
2
回答
dplyr
用不同的函数对多列进行汇总(折叠)数据集
、
、
、
我正试图通过不同的
dplyr
::summarise /summarise_if函数对数据集进行折叠(折叠),以便在输出数据集中具有相同的命名变量。(Species, year) %>% max <- iris %>%
summarise_at
(vars(matches("Length"
浏览 0
提问于2019-09-08
得票数 1
回答已采纳
1
回答
将多个参数传递给
dplyr
::summarise_if中的函数
、
、
我正在尝试创建一个函数,该函数
使用
summarise_if (或
summarise_at
)来计算数据集中一列
和
许多其他列之间的相关性。each = d %>%
dplyr
::
summarise_at
(vars, cor, x)
浏览 0
提问于2018-08-25
得票数 2
1
回答
如何
在R中按年将值降至顶部
和
底部的1%
、
、
我试图降低观察,在顶部
和
底部的价格百
分
之一,按年。我一直试图
使用
dplyr
的
group_by
函数对year_sold进行分组,然后
使用
mutate()创建一个变量to_drop,其值取决于变量price在第1百
分
位数
和
第99百
分
位之间。df <- df %>%
dplyr
::
group_by
(year_sold) %>% mutate(to_drop = i
浏览 0
提问于2020-11-18
得票数 1
回答已采纳
3
回答
将%>%
与
colnames()这样的替换函数
一起
使用
<-
、
、
我
如何
使用
管道运算符来管道到替换函数,如colnames()<-?这是我想要做的:averages_df <- summarise(mean(disp), mean(hp105.1364 82.63636# 3 8 353.1000 209.21429averages_df <-
group_b
浏览 0
提问于2015-01-23
得票数 85
回答已采纳
1
回答
Dplyr
按组计算平均值,然后计算每个组的
分
位数
、
、
、
我对
dplyr
有一个问题,或者我只是不知道
如何
正确地编写
分
位数
部分。我有一个要按X
和
Y分组的数据,然后计算每个组中a的平均值
group_by
(x,y) %>%这部分可以工作,没有问题。
如何
继续代码以获得每个组的最低10%
和
最高10%的百
分
位数
?
浏览 0
提问于2017-10-25
得票数 1
1
回答
用R中的ID变量计算NA百
分
比
、
、
要按ID组计算百
分
比NA,在R中,有很多关于可变列计算NA的文章,但是几乎没有按行组来计算。
浏览 1
提问于2020-01-08
得票数 0
回答已采纳
1
回答
使用
SparkR分组百
分
位数
、
、
我想
使用
SparkR计算分组百
分
位数
。method for function ‘approxQuantile’ for signature ‘"GroupedData", "character", "numeric", "numeric"’library(
dplyr
) mtcars
浏览 0
提问于2018-08-28
得票数 1
回答已采纳
1
回答
如何
在
dplyr
和
group_by
中
使用
分
位数
、
我尝试
使用
分
位数
,然后按组(年份,其中有两年)进行子集。我想我可以用
dplyr
做到这一点,但它不起作用:
group_by
(year) %>% summarise(ranker = quantile(Expense, prob
浏览 0
提问于2016-06-16
得票数 15
4
回答
按变量名引用列
、
、
、
simVec[s] dat %>%
dplyr
::
group_by
(ID_s) %>% dat %>%
dplyr
::
group_by
(ID_s) %>
浏览 30
提问于2019-10-23
得票数 0
回答已采纳
1
回答
R中一个完备数据群的方差
、
、
假设我有一个包含10+1列
和
10行的数据,每个值都有相同的单位,除了一个列(“分组”列A)。我试图完成以下工作:给定基于最后一列的数据帧分组,
如何
将整个块的标准差计算为一个单一的整体变量。假设我进行分组(实际上,它是一个间隔的cut ):根据我收集到的这个站点的trhoughout,您可以
使用
聚合或其他
dplyr
方法来计算每列的方差,即: (如果我有<10 rep,就不会
让
我嵌入)。
和
每个组(以及
使用
浏览 0
提问于2018-09-07
得票数 0
回答已采纳
1
回答
R:
使用
错误的
dplyr
结果用不同的求和函数对多列进行汇总?
、
、
、
我
使用
dplyr
让
它正常工作,但它给了我一个错误。我尝试了以下代码: CJd <- CJre %>%
group_by
(date) %>%
summarise_at
(vars(purchase_own, purchase_any, CIT, FIT,(vars(duration, difference), mean) %>%
summarise_at
(CountTP, max) 这会导致错误: Error in .f(.x[[i]], ...) :object
浏览 22
提问于2019-04-23
得票数 0
1
回答
将适当的子集四
分
位数
附加到数据集
、
、
、
第一列将确定球员的年龄在数据集中的所有球员中的四
分
位数
。第二个额外的列将确定一个球员的年龄在他的位置中的哪个四
分
位数
(即,控球后卫,小前锋,中锋等)。我可以
使用
dplyr
包来计算基于球员位置的子集年龄四
分
位数
,但我不知道
如何
将其连接回原始数据集,或者这是否是正确的方法。 我已经
使用
dplyr
根据位置计算了子集年龄四
分
位数
。我尝试过
使用
其他包,比如
浏览 18
提问于2019-03-28
得票数 0
1
回答
对
group_by
()
和
dplyr
使用
ntile()
、
、
、
、
我想要计算data.frame中组的五
分
之一,如下所示: df <- data.frame(x=1:100, y=c(rep("A", 50), rep("B", 50)))
使用
dplyr
中的ntile()函数
和
group_by
,我想我可以得到如下所示的分组的五
分
位数
。但是,正如我们从表中看到的那样,已针对整个数据集计算了五
分
位数
。我想要得到一个结果,在这种情况下,A
和
浏览 15
提问于2019-12-18
得票数 2
回答已采纳
1
回答
如何
将summarize_at
和
需要在R中输入多列的自定义函数组合在
一起
?
、
、
、
、
我想
使用
summarize_at来告诉他们超过(或低于)分配的百
分
比。但是,我不知道
如何
通过summarize调用来传递我的自定义函数。下面是一个示例数据集: library(
dplyr
) scheduled_
浏览 27
提问于2021-08-02
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
dplyr和tidyr简介 数据处理
快速掌握R语言中类SQL数据库操作技巧
R语言必学包之dplyr
如何使用dplyer包进行数据转换
向右操作符及其相关函数的基本用法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券