在R中,可以使用sample()
函数从变量的每个级别中抽取相等数量的单元。sample()
函数可以从给定的向量中随机抽取指定数量的元素。
下面是一个示例代码,演示如何从R中变量的每个级别中抽取相等数量的单元:
# 创建一个示例数据框
data <- data.frame(
var1 = c("A", "A", "B", "B", "C", "C"), # 变量的每个级别
var2 = 1:6 # 其他变量
)
# 计算每个级别的数量
level_counts <- table(data$var1)
# 计算每个级别应该抽取的数量
sample_size <- min(level_counts)
# 从每个级别中抽取相等数量的单元
sampled_data <- data[unlist(lapply(unique(data$var1), function(x) sample(which(data$var1 == x), sample_size))), ]
# 打印抽取的结果
print(sampled_data)
在上面的代码中,首先创建了一个示例数据框data
,其中包含一个变量var1
的不同级别。然后使用table()
函数计算了每个级别的数量,并将其存储在level_counts
中。接下来,计算了每个级别应该抽取的数量,即所有级别中最小的数量,存储在sample_size
中。
最后,使用lapply()
函数和sample()
函数从每个级别中抽取相等数量的单元。lapply()
函数用于遍历每个级别,sample()
函数用于从每个级别中随机抽取指定数量的单元。最后,使用unlist()
函数和which()
函数将抽取的单元的索引转换为逻辑向量,并使用该逻辑向量从原始数据框中选择对应的行。
请注意,上述代码仅适用于每个级别的数量相等的情况。如果每个级别的数量不相等,可以根据具体需求进行调整。
腾讯云相关产品和产品介绍链接地址:
请注意,以上产品仅作为示例,具体选择和推荐的产品应根据实际需求和情况进行评估。
领取专属 10元无门槛券
手把手带您无忧上云