Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >R:计算一个因子和group by组合在data.frame中的比例

R:计算一个因子和group by组合在data.frame中的比例
EN

Stack Overflow用户
提问于 2020-11-11 09:49:51
回答 1查看 51关注 0票数 1

我想用group by在一个数据框上用summarise做几次计算。输入数据:

代码语言:javascript
运行
AI代码解释
复制
dat <- data.frame (ID = c(1:10),
                   var1 = as.factor(c("A","B","A","A","B","B","B","C","A","B")),
                   Var2 = as.factor(c("low","medium","low","low","medium","high","high","high","high","high")))

现在我想在var1上做一个group by,计算ID,并计算var2 = high的比例。我的输出应该如下所示:

代码语言:javascript
运行
AI代码解释
复制
  var1 total prop_high
1    A     4      0.25
2    B     5      0.60
3    C     1      1.00

到目前为止,我得到了以下代码,但我被比例计算卡住了

代码语言:javascript
运行
AI代码解释
复制
dat2 <- dat %>% 
  group_by(var1) %>%
  summarise(total = n(),
            prop_high = )
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-11 10:00:15

您可以取逻辑值的mean来获得比例。

代码语言:javascript
运行
AI代码解释
复制
library(dplyr)

dat %>% 
  group_by(var1) %>%
  summarise(total = n(),
            prop_high = mean(Var2 == 'high'))
            #Same as
            #prop_high = sum(Var2 == 'high')/n())

#   var1  total prop_high
#  <fct> <int>     <dbl>
#1 A         4      0.25
#2 B         5      0.6 
#3 C         1      1   
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64784082

复制
相关文章
【R语言】R中的因子(factor)
R中的因子用于存储不同类别的数据,可以用来对数据进行分组,例如人的性别有男和女两个类别,根据年龄可以将人分为未成年人和成年人,考试成绩可以分为优,良,中,差。
生信交流平台
2022/09/21
3.4K0
【R语言】R中的因子(factor)
R语言 分组计算,不止group_by
最近在研究excel透视图,想到好像自己在R-分组操作并不是很流畅,顺便学习分享一下。R自带数据集比较多,今天就选择一个我想对了解的mtcars数据集带大家学习一下R语言中的分组计算(操作)。
拴小林
2020/07/10
8.3K1
NST: 轻松计算随机性比例的R包
今年8月份写了一篇文章介绍了normalized stochasticity ratio (NST),可以计算随机性和确定性的比例。详见:
Listenlii-生物信息知识分享
2020/05/28
5.7K2
R语言 list与data.frame转换
背景:下载某数据库的数据做数据分析,发现下载的数据结构是多层list嵌套,与平时遇到的数据表(data.frame)不同,并且第二层list的名称是本人需要的变量。
拴小林
2022/04/18
3.1K0
R语言 list与data.frame转换
混合线性模型如何检测固定因子和随机因子的显著性以及计算R2
很多朋友写信问我, 像要知道固定因子的显著性和随机因子的显著性如何计算,他们使用的是lme4这个R包, 但是这个包使用anova时没有P值,还要手动计算, 随机因子也需要自己计算loglikehood值, 然后使用LRT的卡方检验进行显著性检验, 其实lme4包有扩展的包可以非常友好的做这件事情.
邓飞
2019/07/07
4.2K0
混合线性模型如何检测固定因子和随机因子的显著性以及计算R2
【R语言】因子在临床分组中的应用
我们还是以TCGA数据中的CHOL(胆管癌)这套数据为例。关于这套临床数据的下载可以参考
生信交流平台
2022/09/21
3.4K0
【R语言】因子在临床分组中的应用
Threejs入门之十四:Threejs中的组(Group)对象
组其实就是一个集合,将不同的物体添加到一个组中,就形成了一个集合; 比如我们可以创建两个物体,然后将这两个物体使用group.add方法添加到同一个组中
九仞山
2023/04/30
3.2K0
Threejs入门之十四:Threejs中的组(Group)对象
【板子】计算一个数的因子的个数
今天做题的时候做了一道这个题,其中需要算一个数的因子的个数. Let’s denote d(n) as the number of divisors of a positive integer n. You are given three integers a, b and c. Your task is to calculate the following sum: Find the sum modulo 1073741824 (2^30). Input The first line contains
灯珑LoGin
2022/10/31
6070
R语言主成分和因子分析
主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。 1.R中的主成分和因子分析 R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal() psych包中有用的因子分析函数 函数描述 principal()含多种可选的方差放置方法的主成分分析fa()可用主轴、最小残差、加权
机器学习AI算法工程
2018/03/13
2.7K0
R语言主成分和因子分析
快速掌握R语言中类SQL数据库操作技巧
在数据分析中,往往会遇到各种复杂的数据处理操作:分组、排序、过滤、转置、填充、移动、合并、分裂、去重、找重、填充等操作。这时候R语言就是一个很好的选择:R可以高效地、优雅地解决数据处理操作。(本章节为R语言入门第二部分总结篇:数据操作)
1480
2019/09/25
5.7K0
快速掌握R语言中类SQL数据库操作技巧
边缘计算和云计算如何结合在一起
行业专家对网络延迟、一致性、安全性、成本等问题进行了分析,并对一些边缘用例进行了探讨。尽管云计算和边缘关系的实际架构仍在不断涌现和发展,但无疑存在互补关系。其中的一种基本模式是,在混合云或核心云平台与运营环境的最外边缘之间存在“基础设施边缘”。基础设施边缘可以处理数据、路由流量或执行对延迟敏感的任务,同时将其余任务发送回云平台。
静一
2021/03/26
6280
[图解MySQL]MySQL组提交(group commit)
Redo log的刷盘操作将会是最终影响MySQL TPS的瓶颈所在。为了缓解这一问题,MySQL使用了组提交,将多个刷盘操作合并成一个,如果说10个事务依次排队刷盘的时间成本是10,那么将这10个事务一次性一起刷盘的时间成本则近似于1。
田帅萌
2019/06/15
2.4K0
activiti(十)组任务Group
部署流程 开启流程 查看当前人的组任务 组任务拾取个人任务 完成任务(组任务最后也要个人来完成)
周杰伦本人
2023/10/12
2770
activiti(十)组任务Group
一套完整的基于随机森林的机器学习流程(特征选择、交叉验证、模型评估))
为了展示随机森林的操作,我们用一套早期的前列腺癌和癌旁基因表达芯片数据集,包含102个样品(50个正常,52个肿瘤),2个分组和9021个变量 (基因)。(https://file.biolab.si/biolab/supp/bi-cancer/projections/info/prostata.html)
生信宝典
2021/11/23
9.8K0
Solr中Group和Facet的用法
先来看一下Group与Facet的区别: 相同点:两者都能分组一个或多个字段并求数量,并支持组内分页 不同点: facet可以对分组数量进行过滤,以及排序,和日期范围,时间范围分组,但是如果
我是攻城师
2018/05/14
1.9K0
Linux 中的 Process Group 和 Session
使用了这么多年的 Ubuntu, 自以为 Linux 下进程的概念已经很熟悉了, 然而发现进程组(Process Group)和会话(Session)两个概念日常并不会接触很多, 平时也没有注意, 导致今天遇到一个问题还想了半天才想明白.
爬虫技术学习
2023/02/10
1.8K0
Linux 中的 Process Group 和 Session
集合在开发中实践中的应用
(1)根据用户需求处理各种数据,作为开发者应该将各种数据分类成各种对象,在程序中处理对象
wfaceboss
2019/04/08
4260
golang 中 map 的装载因子以及 B 的计算逻辑
大家好,在上篇文章hash表在golang语言中的实现中介绍了下golang中map的数据结构以及底层的存储逻辑。在介绍数据结构的时候,其中hmap中有一个重要的字段:B。我们知道B值是用来确定buckets数组大小的。那么,在用make初始化一个map的时候,B值是怎么计算的呢?本文就来介绍下B值的计算逻辑。
Go学堂
2023/01/31
7620
bootstrap 按钮组 btn-group
<div class="btn-group"> <button type="button" class="btn btn-default">Left</button> <button type="button" class="btn btn-default">Middle</button> <button type="button" class="btn btn-default">Right</button> </div>
用户5760343
2019/07/05
9610
实践 Mysql Group Replication 组复制
简介 之前简单介绍了一下 Mysql 5.7.17 中 Group Replication 组复制的作用和特点,现在我们来实际把它配置起来,以便于更好的理解组复制的思路 实践过程: 在一台服务器上安装3个MySQL(s1,s2,s3) 配置s1,启动 Group Replication 配置s2,添加到组中 配置s3,添加到组中 测试 内容比较长,可能不方便实际操作,我也做了一个PDF版本,您可以下载查看,发送消息 'gr' 会自动回复下载地址 详细配置过程 (1)下载 mysql-5.7.17 https
dys
2018/04/04
1.4K0
实践 Mysql Group Replication 组复制

相似问题

按因子列计算data.frame组中的变量

12

R中的绘图因子比例

13

计算CanvasView的比例因子

18

R矩阵中因子列的比例

22

因子值在R中的比例

28
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档