首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >根据一个数据框中的值在另一个数据框中创建指示符变量

假设我有一个名为iris的数据集。我想在这个数据集中创建一个名为sepal_length_group的指示器变量。此指示器的值为p25、p50、p75和p100。例如,对于一个观察,如果物种是"setosa“,并且如果所有被归类为"setosa”的物种的Sepal.Length等于或小于第25个百分位数,我希望sepal_length_group等于"p25“。我写了以下代码,但它会生成所有NAs:

代码语言:javascript
运行
AI代码解释
复制
library(skimr)

sepal_length_distribution <- iris %>% group_by(Species) %>% skim(Sepal.Length) %>% select(3, 9:12)

iris_2 <- iris %>% mutate(sepal_length_group = ifelse(Sepal.Length <= sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),2], "p25", NA))

iris_2 <- iris %>% mutate(sepal_length_group = ifelse(Sepal.Length > sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),2] &
                                                Sepal.Length <= sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),3], "p50", NA))

iris_2 <- iris %>% mutate(sepal_length_group = ifelse(Sepal.Length > sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),3] &
                                                        Sepal.Length <= sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),4], "p75", NA))

iris_2 <- iris %>% mutate(sepal_length_group = ifelse(Sepal.Length > sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),4] &
                                                        Sepal.Length < sepal_length_distribution[which(sepal_length_distribution$Species == "setosa"),5], "p100", NA))

任何帮助我们都将不胜感激!

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-05-19 23:46:35

这可以通过使用@Camille注释的函数cut来简单地完成

代码语言:javascript
运行
AI代码解释
复制
library(tidyverse)
iris %>%
  group_by(Species) %>%
  mutate(cat = cut(Sepal.Length, 
                   quantile(Sepal.Length, c(0,.25,.5,.75, 1)),
                   paste0('p', c(25,50, 75, 100)), include.lowest = TRUE))
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67612049

复制
相关文章
在 Python GTK+ 3 中创建一个框
Windows 用户需要 Windows Subsystem for Linux (WSL)。它在Windows上下文中使用Linux命令和PyGObject。这简化了对库和 GObject Introspection 绑定的访问。
很酷的站长
2023/08/11
3680
在 Python GTK+ 3 中创建一个框
【R语言】根据映射关系来替换数据框中的内容
前面给大家介绍过☞R中的替换函数gsub,还给大家举了一个临床样本分类的具体例子。今天我们接着来分享一下如何根据已有的映射关系来对数据框中的数据进行替换。例如将数据框中的转录本ID转换成基因名字。我们直接结合这个具体的例子来进行分享。
生信交流平台
2022/09/21
4K0
【R语言】根据映射关系来替换数据框中的内容
【PY】根据 Excel 中的指示修改 JSON 数据
继上一次友友问了如何处理 Excel 中的数据之后,这次他又遇到了新问题,让我们一起来看看;
sidiot
2023/08/31
2700
【PY】根据 Excel 中的指示修改 JSON 数据
pandas中数据框的reshape操作
数据框的长宽转换对于熟悉R语言的朋友而言,应该不会陌生。使用ggplot2画图时,最常用的数据处理就是长宽转换了。在pandas中,也提供了数据框的长宽转换功能,有以下几种实现方式
生信修炼手册
2020/07/02
4.6K0
【Python】基于某些列删除数据框中的重复值
Python按照某些列去重,可用drop_duplicates函数轻松处理。本文致力用简洁的语言介绍该函数。
阿黎逸阳
2020/09/08
20.8K0
【Python】基于某些列删除数据框中的重复值
【Python】基于多列组合删除数据框中的重复值
最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。
阿黎逸阳
2020/09/08
14.8K0
Excel实战技巧74: 在工作表中创建搜索框来查找数据
如下图1所示,在数据区域上方放置有一个文本框,用来输入要搜索的文本,其名称重命名为“MySearch”;一个用作按钮的矩形形状,点击它开始搜索并显示结果;两个选项按钮窗体控件,用来选择在数据区域的哪列进行搜索。
fanjy
2020/02/18
16.8K1
根据下拉框 text的值设置选中
参考博客: https://blog.csdn.net/tunnel213/article/details/43766017 https://blog.csdn.net/eluanshi12/article/details/78676861
周杰伦本人
2023/10/12
1990
R语言 | 根据数据框的顺序进行筛选
这里有两个数据框,两者有相同的列(ID),这里想把第一个数据框,按照第二个数据框的ID列进行提取,顺序和第二个数据框一致。
邓飞
2020/08/07
2K0
如何在Vue.js中创建模态框(弹出框)
模态框(弹出层对话框,Modal Popup)在大多数现代应用程序中非常常见。它们主要用于呈现简洁的信息,非常适合显示广告和促销内容。模态框提供了一种快速传达信息的方式,并提供了用户友好的关闭选项。
前端达人
2023/09/12
8670
如何在Vue.js中创建模态框(弹出框)
Bootstrap中input输入框数据验证
输入中文、数字、英文: <input onkeyup="value=value.replace(/[^\w\u4E00-\u9FA5]/g, '')"> 输入数字和字母: <input onKeyUp="value=value.replace(/[\W]/g,'')"> 输入大小写字母、数字、下划线: <input type="text" onkeyup="this.value=this.value.replace(/[^\w_]/g,'');"> 只能输入英文字母和数字,不能输入中文 <input
浩Coding
2019/07/03
5.9K0
根据select下拉框值判断验证条件
根据select下拉框值判断当前选中的是哪个区域,并且判断当前选中区域里面的值是否为空,如果为空,则弹出弹框提示,请输入xx区域名称,以下只是一个小demo,随手复制黏贴到代码里面,能看的更加明白。
王小婷
2019/08/01
3.7K0
根据select下拉框值判断验证条件
在JSP页面中调用另一个JSP页面中的变量
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/details/16896447
DannyHoo
2018/09/13
7.9K0
Day5生信入门——数据结构(!选修!直接使用数据框中的变量!没学!!)
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
用户10776122
2023/10/06
1970
创建一个欢迎 cookie 利用用户在提示框中输入的数据创建一个 JavaScript Cookie,当该用户再次访问该页面时,根据 cookie 中的信息发出欢迎信息。…
利用用户在提示框中输入的数据创建一个 JavaScript Cookie,当该用户再次访问该页面时,根据 cookie 中的信息发出欢迎信息。
全栈程序员站长
2022/07/08
2.7K0
在HTML中的下拉框中怎样实现超连接?
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/113334.html原文链接:https://javaforall.cn
全栈程序员站长
2022/07/07
3K0
在评论输入框中插入表情
最近在做一个后台管理系统,要求可以对前台用户的作品进行评论,而评论要可以输入表情,常规的文字输入框都是用的文本域textarea来做的,但这种输入框只能输入文字,没有办法输入表情图标,这个时候可编辑div就能起到作用了,那么如何在可编辑的div中插入表情呢?
越陌度阡
2020/11/26
4.1K0
seaborn可视化数据框中的多个列元素
seaborn提供了一个快速展示数据库中列元素分布和相互关系的函数,即pairplot函数,该函数会自动选取数据框中值为数字的列元素,通过方阵的形式展现其分布和关系,其中对角线用于展示各个列元素的分布情况,剩余的空间则展示每两个列元素之间的关系,基本用法如下
生信修炼手册
2020/10/19
5.3K0
[Office] 在Excel中,如何根据值求出其在表中的坐标
在使用excel的过程中,我们知道,根据一个坐标我们很容易直接找到当前坐标的值,但是如果知道一个坐标里的值,反过来求该点的坐标的话,据我所知,excel没有提供现成的函数供使用,所以需要自己用VBA编写函数使用 (代码来自互联网)
轻舞飞扬SR
2021/02/24
8.9K0
R语言 数据框、矩阵、列表的创建、修改、导出
数据框来源主要包括用代码新建(data.frame),由已有数据转换或处理得到(取子集、运算、合并等操作),读取表格文件(read.csv,read.table等)及R语言内置数据
Magnolia
2023/01/06
8K0

相似问题

如何根据州级数据框中的值在单个级数据框中创建新变量?

14

根据Pandas中另一个数据框的顶值创建新的数据框

239

如何根据另一个数据框中的数据填充数据框值

133

根据一个数据框中的值汇总另一个数据框中的数据

10

根据R中另一个数据框中的列从数据框中删除变量

32
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文