腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
dplyr
按
值
组
采样
、
我想用
dplyr
制作基于分组
值
的样本: id <- c(1, 1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 6, 7, 8, 8, 8, 8, 8) id <- as.data.frame
浏览 16
提问于2017-06-26
得票数 2
回答已采纳
6
回答
使用特定于
组
的样本大小从数据帧中获取示例。
、
、
我希望使用来自每个
组
的不等样本大小从数据帧中
采样
行。假设我们有一个
按
‘group’分组的简单数据框架:set.seed(123) #> 12 B -0.23017749#> 20 B -0.44566197 使用来自slice_sample包的<e
浏览 0
提问于2021-03-04
得票数 7
回答已采纳
4
回答
随机抽样
组
、
给出一个带有一个名为df的列的dataframe group,如何在
dplyr
中随机地对k
组
进行
采样
?它应该返回k
组
中的所有行(考虑到df$group中至少有k唯一
值
),并且df中的每个
组
都应该同样有可能被返回。
浏览 2
提问于2016-05-10
得票数 23
回答已采纳
1
回答
随机抽样
组
,得到一个平衡
组
基本上,我希望在每个
组
上选择3个id,而不考虑该id重复的次数。欢迎任何帮助。谢谢
浏览 2
提问于2021-05-11
得票数 0
2
回答
自定义分组
dplyr
函数(sample_n)
、
、
我正在尝试以分组的方式将
采样
函数应用于数据帧,其中它应该对每个
组
中的n个样本进行
采样
,或者如果
组
大小小于n,则对所有组成员进行
采样
。使用
dplyr
,我首先尝试mtcars %>% group_by(cyl) %>% sample_n(2)
浏览 93
提问于2019-04-14
得票数 5
回答已采纳
1
回答
某些数据大小小于2的数据列表中的sample_n(2,replace=F)出现问题
、
、
我需要R中‘
dplyr
’中的sample_n()的帮助:我有一个数据riskset[[1]], riskset[[2]],..., riskset[[1000]])列表,列表中的每个元素riskset[[i]]都是一个观察
值
的数据框,我根据一个变量的分布将每个riskset中的观察
值
分为1:4
组
。我想从每个风险集中的每个grp中
采样
2个观察
值
,并将它们保存为样本列表。但它不适用于某些
组
中具有少于2个obs的风险集。对于少于2个obs的
组
,我需要它拥有的
浏览 26
提问于2019-05-23
得票数 0
1
回答
从每个
组
获得最大数目的Sample_n
、
、
使用下面这个非常简单的数据示例,我的目标是对所有3个A进行
采样
,而只对7个B中的5个进行
采样
。B现在,通常只是使用来自
dplyr
的
dplyr
的情况,这样代码就会按照 group_by(group) %>%但这会导致错误(原因
浏览 0
提问于2018-07-15
得票数 2
2
回答
按
dplyr
组
重复该
值
、
我想重复每个
组
(年份)内的
值
,它等于第一类"A“的
值
。category = LETTERS[1:3],data$value = runif(nrow(data)) "lubri
浏览 0
提问于2018-06-27
得票数 0
回答已采纳
3
回答
按
组
选择随机连续行作为组长度的比例
、
、
我如何
按
组
随机选择连续行,并将其作为每个组长度的函数(例如,每组的10 %)library(
dplyr
) cell <- c(rep("a", 100), rep("b", 80df_subset <- df[df[ , (sample(.I[-.N], 1)) + (0:(0.1*.N)), by = cell]$V1]它不以某种
浏览 0
提问于2021-07-21
得票数 1
回答已采纳
3
回答
基于另一个向量R对另一个向量进行重分类
、
、
、
我有两个向量,或者两列data.frame,我想要第一列表示
值
,假设A和第二
组
G,我想根据A的最大
值
除以G来更改组,然后我想更改G的
值
,以便
组
按
最大A排序。3 aggregate(df$A, by=list(df$G), max) 然后,
组
的最大
值
为2 2.6 2.3,
组
3必须变为2,
组</em
浏览 29
提问于2019-09-19
得票数 4
回答已采纳
4
回答
使用
dplyr
(或其他)将包含列表的数据帧列拆分为多个列。
、
考虑下面的示例数据tmp <- mtcars %>% summarise(mpg_sum = list(summary(mpg))) 因此,mpg_sum包含mpg变量的最小、第一四分位数、中值、平均值、第三四分位数和最大
值
(
按
组
划分)。如何用
dplyr
将该列解压缩为6列,并使用
dplyr
或其他方式命名?
浏览 4
提问于2016-07-04
得票数 8
回答已采纳
2
回答
来自示例
值
数组的createPeriodicWave
、
、
我有一条曲线--比如说,正弦曲线--它是以均匀的间隔
采样
成一个Float32Array,称为样本。这条曲线是
按
值
抽样的。如您所见,曲线由每个给定样本的曲线
值
表示。我想从这些示例
值
创建一个,这可以通过使用来完成。 我不太清楚这些
值
对于一系列抽样
值
意味着什么。如何将<
浏览 2
提问于2016-09-27
得票数 2
回答已采纳
1
回答
R中嵌套群的重
采样
我有一个带有嵌套
组
设计的数据集,我需要在每个
组
中随机抽样(带替换),重
采样
事件的数量必须等于每个
组
的样本数(即行数)。此外,嵌套
组
具有多列数据。参见下面的示例df。我有使用
dplyr
包的代码,但是我要离开
dplyr
,因为我必须不断地更新代码,因为
dplyr
更改了函数名,operations...which至少让人讨厌。是的.我知道有几种方法可以绕过这个问题,但我已经决定是时候抛开
dplyr
拐杖,学习如何使用R base包执行数据争用了
浏览 2
提问于2021-02-20
得票数 1
回答已采纳
1
回答
如何提高R中多变量的聚合和汇总速度?
、
、
、
我正在执行重
采样
(即引导)过程,该过程涉及到,作为重复的步骤之一,计算多个
组
中每个
组
的多个数值变量的平均值。我已经找到了使用
dplyr
、doBy和data.table的解决方案,我在下面提供了这些解决方案。 然而,它们中的每一个通常占用一毫秒的时间来完成(按照microbenchmark)。此外,需要计算这些估计的引导置信区间,因此该函数估计每个r区域的这些参数,并从原始数据框架(
按
组分层)替换这些参数。最终,我需要从每个重
采样
(p-by-g-by-r)中知道每个
组
的参
浏览 3
提问于2018-01-20
得票数 0
回答已采纳
1
回答
如何实现以下cabbage_exp数据集的plyr包代码的
dplyr
。任何帮助都会成为学徒
、
、
在这个数据集中,我想计算每个
组
中权重的比例(
按
日期分组)。下面的代码plyr包分裂在“日期”和计算权重的比例在每一<
浏览 1
提问于2017-08-29
得票数 0
回答已采纳
1
回答
dplyr
按
组
与if有条件地过滤
、
、
、
、
在
dplyr
中使用group_by之后,如果有少于x行,我想使用filter对
组
中的所有行进行
采样
,而如果有超过x行,我想从这些
组
中子
采样
特定数目的行。我将用钻石数据集来说明,当
按
清晰度分组时。122586 VVS2 50668 IF 1790 使用此示例,如果所有行都有5066行或更少的行,我希望使用清晰
组
中的所有行进行抽样,而在超过5066行的
组
中,我希望使用s
浏览 0
提问于2018-06-20
得票数 2
1
回答
斯帕克利:如何在不同的群体中获得一个均衡的样本
、
、
我知道
dplyr
::sample_n函数不能用于这个(),所以我使用了sparklyr::sdf_sample()函数。这方面的问题是,我不能
按
组
进行抽样,即从每个类获得10个观测
值
,我只能指定要
采样
的整个数据集的分数。我可以在循环中对每个
组
单独使用sdf_sample(),但是由于函数没有返回确切的样本大小,这仍然不理想。R解决办法的代码:library(
dplyr
) sc <- spark_connect(master
浏览 1
提问于2020-01-13
得票数 3
回答已采纳
1
回答
如何为R中的多个列创建分层
采样
、
、
如何设置
采样
大小?
浏览 22
提问于2020-04-03
得票数 1
1
回答
获取与引导
采样
的唯一
值
相对应的数据帧的索引
我希望找到与我的数据的替换
值
采样
相对应的数据帧的索引,并且我还希望对索引进行过
采样
。由于过
采样
,which无法工作。foreach循环很简单,但太慢了。下面是一个虚拟的例子: library(
dplyr
) foreach(i = samp, .combine = c) %do% {which(mtcars$car
浏览 22
提问于2018-07-10
得票数 0
5
回答
dplyr
-
按
组
并选择顶x%
、
使用包
dplyr
和函数sample_frac,可以从每个
组
中抽取一个百分比。我需要的是首先排序每个
组
中的元素,然后从每个
组
中选择顶部x%?有一个函数top_n,但是这里我只能确定行数,我需要一个相对
值
。例如,以下数据
按
齿轮分组,并在每组中
按
wt进行排序:mtcars %>% group_by(gear) %>%27 4
浏览 0
提问于2015-10-19
得票数 14
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PHP 多维数组按值排序,别抓狂看这里
Java参数传递到底是按 值传递 还是 引用传递 ?
按类别提取N个最大值,公式躲远点
绝地求生将按ping值划分匹配池
Excel 版本低也不怕,用 countif 也能按区间计算、统计唯一值
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券