腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
使用
`
dplyr
`
识别
`
data.frame
`
中
的
重复
项
、
我想
使用
R
dplyr
包
识别
(而不是消除)数据帧
中
的
重复
项
,并相应地添加0/1变量(行是否
重复
)。(
使用
mutate?),比如说E,它等于第1、2、3和4行
中
的
1,因为第3行和第4行也是相同
的
。 此外,我想添加另一个变量F,如果存在
重复
的
仅相差一列
的
变量,则该变量等于1。也就是说,行1、2和5
中
<em
浏览 3
提问于2018-01-25
得票数 0
3
回答
基于另一列删除列
中
的
重复
项
、
、
、
我正在寻找一种更好
的
方法在R
中
实现这一点,我确实有一个可能性,但它似乎应该有一个聪明
的
/更易读
的
方式。 我想删除一个/多个列
中
的
重复
项
,只有在另一列(或多列)满足条件时才删除。在我
的
简化示例
中
,只有当列X是NA时,我才希望删除列NA
中
的
重复
项
,但在Y中保留NA
的
副本而不复制X。testDF<-
浏览 0
提问于2018-06-22
得票数 2
回答已采纳
2
回答
按组查找逐行复制。
、
、
我有一个可能有
重复
产品
的
数据集。如果有
重复
的
产品,我们将标记为"Y",反之亦然。", "Y", "Y", "Y", "N"14L), class = "
data.frame
这主要是为了确定一个特定<em
浏览 3
提问于2017-03-29
得票数 1
回答已采纳
2
回答
在包代码
中
从其他包
的
命名空间中查找对象
、
、
、
、
我正在重构一个包,它导入了许多其他包
的
完整名称空间。我认为,这些依赖
项
中
的
许多都用于单个函数调用,
使用
importFrom会更好地处理这些依赖
项
,或者是不再
使用
的
孤立依赖
项
。包中有足够
的
代码,手动检查每一行查找不熟悉
的
函数调用将是单调乏味
的
。 如何确定在包中
使用
来自导入
的
命名空间
的
对象
的
位置和次数?请注意,此包
浏览 27
提问于2021-05-12
得票数 9
3
回答
在R中保留NA
的
同时删除
重复
项
、
我有如下所示
的
数据:print(a)A 1C 3<NA> 5我尝试在不
使用
R
的
情况下删除
重复
项
,将<NA&g
浏览 17
提问于2018-01-26
得票数 2
回答已采纳
2
回答
多变量
的
Pivot_wider函数(tidyr包)
、
、
但我对此作出评论,因为最初
的
df是480行和几个子级别。library(
dplyr
)df <-"2012"), Region_UN = c("A", -4L), class = c("tbl_
浏览 6
提问于2021-05-13
得票数 3
回答已采纳
3
回答
使用
dplyr
重复
示例
data.frame
、
、
、
我有这个
data.frame
groups <- rep(c("GroupA", "GroupB"), each = 500)
使用
dplyr
,我可以对100行df进行采样,然后计算GroupA和GroupB平均值之间
的
差异。(.replicate = 1) %>% difference.mean.x .re
浏览 4
提问于2015-02-20
得票数 2
回答已采纳
2
回答
删除所有
重复
行
、
从这个
data.frame
开始:df =
data.frame
(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),1 0 24 2 1 46 0 1 68 1 0 810 0 1 10 我想根据前两列删除带有
重复
项
的
所有行
使用
来自distinct
dplyr
的
<e
浏览 11
提问于2022-09-14
得票数 0
回答已采纳
3
回答
在其他相同
的
行
中
查找唯一条目
、
每一行应该代表一个个体,这意味着ID列
中
的
值都应该是唯一
的
(而不是
重复
的
)。 有些行被复制,ID列
中
的
重复
条目和看似相同
的
响应
项
值(x1 - xn)。如下面的代码所示,如果所有变量
的
行都是完全相同
的
,则可以
使用
dplyr
::distinct()函数删除
重复
行。在我
的
例子
中
,并非所有“<em
浏览 4
提问于2022-01-17
得票数 2
回答已采纳
1
回答
修正R
中
的
效果: plm vs lm + factor()
、
、
我试图在R
中
运行一个固定效果
的
回归模型,我想控制变量C和D
的
异质性(都不是时间变量)。我尝试了以下两种方法:formula = Y ~ A + B + C + D 我还尝试
浏览 1
提问于2016-09-19
得票数 3
2
回答
函数在
dplyr
管道
中
的
应用
、
、
给出像data这样
的
数据帧 value = rnorm(200))library(
dplyr
) filter(group ==
浏览 6
提问于2020-08-17
得票数 0
回答已采纳
3
回答
在R结果数据帧
中
合并数据帧太大
、
、
、
我正在尝试合并R
中
的
两个数据帧,通过它们共享
的
一列来连接它们。下面是两个数据帧
的
屏幕截图,我在"INC_KEY“列上合并。 D有177156个观测值,p有1641137个观测值,但最终合并
的
数据帧有8416113个观测值,我还尝试将上面的inner_join函数更改为merge函数,但仍然得到相同
的
结果。我想知道如
浏览 0
提问于2021-01-11
得票数 0
2
回答
根据部分
重复
的
值从
data.frame
中
消除行
、
、
我有一个相对较大
的
data.frame
,有205K
的
观察值和54个变量。此
data.frame
是附加三个不同data.frames
的
结果。原始data.frames都有date、time、lat和lon列,但是每个
data.frame
都包含我需要保留
的
附件信息。因此,在最终
的
data.frame
中
,我有三行组成
的
集合,其中日期、时间、时间、纬度完全相同,但var1、var2等
的
值不
浏览 14
提问于2020-11-13
得票数 0
1
回答
使用
match填充数据框后
的
因子水平问题
、
、
我
使用
两个大型数据文件,每个文件都有>2m记录。样本数据帧为但给了我Levels: 0 1 120 512 621 S 在x
中
只有四个不同<em
浏览 0
提问于2018-10-24
得票数 2
2
回答
变异以在每一行
中
创建最小值
、
我有一个问题,就是在
dplyr
中
使用
基于另外两列
的
mutate函数在新列
中
创建一个最小值。a =
data.frame
(runif(5,0,5)) b =
data
浏览 3
提问于2016-02-11
得票数 7
回答已采纳
1
回答
如何从R
中
的
数据帧
中
删除
重复
列?
我有一个包含许多
重复
列
的
data.frame
,例如:是否有删除
重复
列
的
函数(基R或
dplyr
)?unique()删除
重复
行。 与不同,我
的
列已经有不同
的
名称,但是值是相同
的
。
浏览 3
提问于2019-10-20
得票数 2
回答已采纳
1
回答
唯一值上
的
r ifelse循环总是解析FALSE。
、
、
与df:rank = c(1,2,1,3,3,4) 我跑:} 我试图将$dg变量标记为T,条件是每个唯一id
的
秩是不同
的
,如果秩在每个id
中
是相同
的
,则F。我没有收到任何错误,但我只得到F
的
所有值
的
$dg,即使我应该得到一个混合。我还
使
浏览 3
提问于2017-06-27
得票数 3
回答已采纳
2
回答
如何创建部分
重复
行
的
新数据(基于45列
中
的
4列
的
重复
数据)
、
、
我有一个很大
的
数据集,其中大约10%是“双重编码”。一名研究助理重新收集了部分数据
的
数据,这样我们就可以确保数据
的
准确性。大多数情况下,我想检查拼写错误和其他不符之处。我只想将双编码行提取到一个新
的
数据帧
中
,这样我就可以读取它们以确保它们匹配,然后删除
重复
的
行。 我可以根据4个ID列(链接、BillType、BillNumber、Name)
识别
重复
的
数据。我知道如何根据一定数量
的
列
识别</e
浏览 8
提问于2022-10-09
得票数 0
3
回答
如何将
data.frame
列
中
的
字符串
重复
n次
、
、
我正尝试在
dplyr
中
执行以下操作: 如果我有一个包含序列(df)
的
数据帧,并且希望将每行
中
的
序列
重复
n次(df2),我如何才能获得一个可以在
dplyr
中
执行此操作
的
表(answer = df2)?df <-
data.frame
(start = c("ATG", "ATG", "ATG"), seq = c(&qu
浏览 25
提问于2020-06-15
得票数 1
回答已采纳
2
回答
与R
中
的
原始观测一起
识别
重复
(可能通过聚类)
、
我已经找到了
重复
的
答案,但是如果我只
使用
复制
的
()和/或唯一
的
()函数,我只能得到
重复
的
(没有原点)或唯一
的
值(没有
重复
的
)。我想知道哪一种是
重复
的
,哪种观察是
重复
的
。(id,show,v1,v2,v3); df 这是我用来
识别
副本
的
脚本。一个对我有很大帮助
的
解决方案是,如果我能够确
浏览 2
提问于2016-10-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
WPS表格拒绝录入重复项的使用方法
使用Python查找目录中的重复文件
删除数据重复项,Excel中的这3种方法简单高效
快速掌握R语言中类SQL数据库操作技巧
在VBA中如何使用动态数组,以及利用动态数组去除重复值的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券