腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
data.table
-
在
R
中
过滤
按
ID
分组
的
行
、
、
<- mydata[, grp := cumsum(c(0, diff(year)==1)), by =
ID
][,max_grp := max(grp), by=
ID
][max_grp>=2]mydata2 <- mydata2[which(year >= max(year - 2)), by =
ID
]Warningmessage: In `[.
data.table
浏览 11
提问于2020-05-15
得票数 0
回答已采纳
1
回答
如何删除
r
中
data.table
中
的
所有重复
行
、
、
假设我们有dt <-
data.table
(Date = c(201405,201405,201504,201505, 201505,201505),
ID
= c(500,500,600,700,500, 700), INC = c(20,30,50,75,80,90)) Date
ID
INC3: 201504 600 505: 201
浏览 1
提问于2015-10-21
得票数 5
回答已采纳
2
回答
删除具有特定条件
的
行
、
我
的
数据设置如下:Apr 4 1 21Apr 6 1 23Apr 6 2 32在上面的示例
中
,最后一
行
是
ID
=2
的
最高日期,但不是该
ID
的
最高权重。我可以设置一个for循环,它基本上输出一个具有最大日期
的
权重和
浏览 0
提问于2013-09-21
得票数 0
2
回答
根据条件(位置)删除重复
行
、
、
我有一个数据集,看起来像这样 df <- data.frame("
id
" = c("Alpha", "Alpha", "Alpha","Alpha","Beta","Beta","Beta","Beta和时间标识符都有多个观察--例如,我有3个不同
的
alpha 1970值。我希望每个
id
/年只保留一个观察结果,最显著
的
是每个
id</
浏览 7
提问于2019-09-29
得票数 1
回答已采纳
1
回答
因子
的
R
,最大值
、
我想使用
R
,并且有一个简单
的
dataframe:第一列是
ID
,第二列是分数。每个
ID
有36
行
和相应
的
分数。有几千张身份证。我想要生成一个摘要,其中包含:每个唯一
ID
的
一个条目,以及它们
在
36
行
中
的
最大得分。apply(dataframe,2,max)将给出最大值,但不
按
ID
细分。我知道有一系
浏览 0
提问于2015-07-13
得票数 0
回答已采纳
2
回答
按
条件查找最后值
、
、
我有一个非常大
的
数据框架,我需要根据最后
的
值进行子集。我知道
data.table
库包含last()函数,它返回数组
的
最后一个值,但我需要
的
是根据
id
中
的
最后一个值对track
中
的
每个单独值进行子集。
id
中
的
值是连续整数,但每个track
的
最后一个值都不同。> head(foo) track
id
coords.x c
浏览 6
提问于2016-12-26
得票数 0
回答已采纳
2
回答
根据标准从数据集中删除重复项
我有一个分数数据集: 1 Mat 45 3 Mat5 Sci 78 1 Mat 56我只想输出每个主题
的
每个
ID
的
最高分数。例如,新
的
列表应该显示:
浏览 4
提问于2016-02-06
得票数 1
回答已采纳
1
回答
检查在
data.table
中使用by创建
的
块
、
是否有一种简单
的
方法来检查在
data.table
中使用“by”时创建
的
数据块之一?例如,如果我将虹膜
按
“物种”
分组
ir[, someFunction(), by = Species]我希望能够看到所有的变量,以确保
分组
是正确
的
,但是
在
使用'by‘
中</e
浏览 2
提问于2015-08-17
得票数 1
回答已采纳
2
回答
R
:
按
元素
id
划分
的
列表列表
我想把我
的
列表
按
id
分开,并有可能把产品
的
价值加起来。我遇到了lapply,但不幸
的
是,没有找到任何使用聚合嵌入
的
lapply
的
解决方案。list1 = list(
id
=1 , product=5)list2 = list(
id
=2 , product=5)list4 = l
浏览 1
提问于2018-02-05
得票数 1
回答已采纳
2
回答
有条件地删除
R
中
的
行
、
、
我有一个数据,其中第一列是一堆
ID
数字(有些重复),而第二列只是一堆数字。我需要一种方法,根据第二列中最小
的
数字,将每个
ID
号保持一次。Row#
ID
Number2 12 1674 12 1356 15 133 例:我只想在这里保留Row# 1、4和6,并删除其余
的
浏览 2
提问于2015-06-15
得票数 6
回答已采纳
3
回答
列
中
的
计数值使用空单元格表示新
的
数字。
、
、
、
我想用行为数据来计算捕捉到
的
物品
的
数量。这是我
的
示例数据: type= c("(K)","(K)","(K)","(K)","","","","(K)","(K)"
浏览 4
提问于2017-05-01
得票数 2
回答已采纳
1
回答
提取由具有大量级别的多个因素定义
的
行
、
、
、
、
我想做什么 我有一个有几个
分组
因素和一些其他数据
的
数据框架。我想根据这些因素对行进行
分组
,并标记或提取属于具有多个成员
的
组
的
所有
行
。即使是drop = TRUE,随着级别数
的
增加,interaction()
的
运行时间也会急剧增加。最后,我想在一个有几十万行
的
data.frame上处理多达50,000个级别的10-20个因素。问题: 1)解决这个问题最有效
的
方法是什么?(根据执行时间、内存需求和代码
的
浏览 1
提问于2017-02-28
得票数 2
回答已采纳
1
回答
R
data.table
分组
方式
、
我
在
R
data.table
中有以下内容:============= 1 | B 2 |B 4 | A我只想显示
按
id
分组
的
行
,其中包含A,而不是B。因此,结果将如下所示:============= 3
浏览 0
提问于2017-12-12
得票数 2
3
回答
在
R
中
获取具有多年完整数据
的
观察值
的
描述性统计
、
我有以下面板数据集1 1 502 2 403 2 544 2244 4 30 我想获得观察者有信息可用
的
年数
的
描述性统计数据,例如:只有一年信息
的
个人数量是1,只有两年信息
的
个人数量是1,而拥有三年可用信息
的
个人数量是2。
浏览 12
提问于2017-08-31
得票数 1
回答已采纳
1
回答
使用
R
为每个
id
的
列
中
的
每个单元格创建逗号分隔字符值
、
我有2列
ID
和Product:A ClothingA FoodC Food如何使用
R
创建一个数据文件,其中每个
ID
都将产品分隔为逗号,如下所示:A Clothing, Food, FurnitureC Food, Clothing
浏览 1
提问于2016-02-09
得票数 0
回答已采纳
2
回答
根据值
的
索引找出最小值
1976-04-27 0.3 85 1976-04-28 2.0 4对于每一个唯一
的
‘日期’,我想找到'val‘对应于最小
的
’高度‘。因此,我最终想要
的
答案是1和7。indx <- tt == uniq_tt[i] a[i] <- d2[which.min(d2[,2]),3][1] 1 7 但希望有一种没有循环
的
方法
浏览 5
提问于2016-01-13
得票数 1
回答已采纳
1
回答
基于事件发生
的
数据集
过滤
我有一些大型数据集(超过500,000
行
),我想在
R
中
过滤
它,我只想保留最相关
的
信息,所以我认为只保存元素
的
出现大于某个值
的
行
是个好主意。例如,我有以下数据:2 52 82 91 0 A B
浏览 3
提问于2015-10-09
得票数 1
回答已采纳
1
回答
通过
过滤
一列
中
的
数据创建
分组
盒图。
、
、
我希望通过
按
年份(< 1993 )和年份>( 1993 )
过滤
一列
中
的
数据来创建
分组
盒图。library(tidyverse)years <- c(1991,1992,1993,1994,1995,1991,1992,1993,1994,1995) values <- c(12.1,11.5,12.0,12.4,12.2,11.8,11.4,12.2
浏览 6
提问于2019-11-04
得票数 0
回答已采纳
1
回答
用
data.table
按
聚合值划分子集
、
、
假设我将
data.table
按
某一列
分组
,并计算每个组
的
值。然后,我要删除具有计数N < 2
的
组。有没有一种高效
的
,
data.table
的
方法来做到这一点?示例数据:-------------2 | "A"4 | "C"现在:
按
浏览 3
提问于2020-05-22
得票数 0
回答已采纳
2
回答
从低于阈值
的
数据帧
中
删除
行
41883098 1 HJ898: 8 41884555 1 ZX567我希望
在
data6
中
保留其最大EID列值大于每个S_
ID
(删除每个S_
ID
的
EID值为1或2)
的
所有
行
。3 C135: 5 41883100 5 T5-7 第6
行
和第7
行
被删除,因为对于它
浏览 4
提问于2015-10-15
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
CSV数据读取,性能最高多出R、Python 22倍
快速掌握R语言中类SQL数据库操作技巧
必学包之dplyr包
R编程精要:数据科学视角下的员工计算机监控软件分析
关于data.table中i,j,by都为数字的理解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券