腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
识别
并
删除
数据
帧
中
按
主题
和
条件
分组
的
离群
值
、
我对r
和
tidyverse包来说都是新手,所以请耐心听我说。 ) 这似乎是可
浏览 22
提问于2019-11-13
得票数 0
回答已采纳
1
回答
使用函数返回R中
分组
数据
的
转换
数据
、
、
、
我有一个包含多个
分组
的
大型
数据
集。我已经创建了一个函数,它返回没有任何异常值
的
数据
。因此,如果您有100个观察
值
,它将用NA填充
离群
值
,
并
返回100个观察
值
。)我有一个包含两列
的
数据
帧
,其中包含
分组
变量(例如,男性/female已就业/失业)。第三列将包含需要
删除
异常值
的
实际
数据</
浏览 3
提问于2016-01-06
得票数 0
3
回答
如何使用方框图
删除
异常值?
、
、
、
、
我有
按
公制
分组
日期
的
数据
。我已经绘制了
数据
,现在,如何
删除
框图范围之外
的
值
(
离群
值
)?📷
浏览 0
提问于2019-07-01
得票数 13
回答已采纳
1
回答
单链接层次聚类-在分支高度上绘制箱形图以检测异常值
、
、
、
、
在k-means聚类进行消费者细分之前,我希望
识别
并
删除
样本
中
的
异常值。我尝试了使用单一链接算法
的
层次聚类。问题是,我有一个包含800多个案例
的
样本,并且在我
的
图(单链接树状图)
中
,数字彼此交叉,因此无法读取,因此我不可能仅通过查看图表来清楚地
识别
异常值:-/ 在这里,他们说,您可以基于分支距离创建箱图,以更客观
的
方式
识别
异常值我认为这也是一个很好
的
方法
浏览 73
提问于2020-09-07
得票数 0
1
回答
如何在按R
中
的
另一列
分组
后仅
删除
一列
中
的
异常值
、
、
、
我希望在按类型
分组
后从变量度量
中
删除
异常值。我尝试了下面的代码,但它不起作用。我已经搜索过了,我只遇到了如何
删除
整个
数据
帧
或一列
的
离群
值
。但不是在
分组
之后。
浏览 14
提问于2021-06-11
得票数 1
回答已采纳
1
回答
在谷歌单张中只
识别
异常值
的
功能是什么?
我知道TRIMMEAN函数可以帮助将异常值自动排除在平均值之外,但是是否有一个只会
识别
哪些
数据
点是真正
的
离群
点呢?我
的
工作是在经典定义
的
离群
值
为3 SD,远离平均值,在25%
的
底部
和
25%
的
数据
。我需要这样做,以验证我
的
R代码确实正在
删除
真正
的
异常值,因为我们正在为我们
的
研究目的在我
的
实验室<
浏览 3
提问于2021-04-12
得票数 0
回答已采纳
1
回答
识别
和
更改组
中
的
极端日期时间异常值
、
我有一段
数据
帧
,用来
识别
那些没有
和
其他人同时断开连接
的
设备(基本上就是那些忘记挂机的人)。我已经按照UniqueCallID
和
LeaveTime对这个切片进行了排序,因此
离群
值
始终是会议“组”
中
的
最后一个,如果差异超过x个时间量(60分钟或1小时),我希望将该
离群
值
的
LeaveTime更改为前一个
离群
值
的
我尝试
浏览 31
提问于2019-06-28
得票数 1
1
回答
按
五分位数选择
和
排序复杂
数据
帧
、
、
我有一个复杂
的
数据
帧
(orig_df)。在这25列
中
,有5列是我希望用作
分组
标准
的
描述
和
特征。其余
的
是时间序列。有成千上万
的
行。我在初步分析和数字总结中注意到,在一些特定
的
分组
标准
中
,异常观察存在重大问题。我使用了"group by“,
并
查看了这些组
中
的
五分位数结果。我想要消除相对于(基于
分组
浏览 12
提问于2018-01-07
得票数 0
1
回答
有没有办法
按
因子
和
分段对
离群
值
进行
分组
?
我试图得到
按
因子
和
分段
分组
的
离群
点。column_name)$out),unnest(stat, boxplot) %>%eval
中
的
错误
浏览 1
提问于2021-12-17
得票数 0
1
回答
如何以及何时处理
数据
集中
的
异常值(一般策略)
、
、
、
我遇到了以下问题: 我正在做一个
数据
科学
的
初学者项目。我得到了测试
和
训练
数据
拆分,现在我正在分析每个特征,然后将其添加到离散连续变量
的
数据
帧
或连续变量
的
数据
帧
中
。在这样做
的
时候,我遇到了一个
离群
值
很大
的
特征。如果我要
删除
它们,我已经添加到我
的
子
数据
帧
浏览 11
提问于2021-03-25
得票数 1
1
回答
如何针对缩放
数据
从非缩放
数据
中
删除
数据
?
、
我现在使用
的
是R,在这里,我正在缩放原始
数据
,
删除
所有Z分数为3或更多
的
离群
值
,然后过滤掉未缩放
的
数据
,使其只包含非
离群
值
。我希望在
删除
离群
值
后留下一个包含非缩放数字
的
数据
帧
。这就是我
的
脚步:
浏览 2
提问于2017-07-25
得票数 0
回答已采纳
2
回答
去掉不合逻辑
的
观察,我能做吗?
所以我
的
数据
有一些不合逻辑
的
条目,在下面的图片中你可以看到一个在公司工作了11年的人,他拿了100美元,这肯定是错误
的
,应该
删除
对吗?我是否应该根据服务年限
和
薪水来消除这些糟糕
的
观察结果呢?或者我应该保留它们,它们是正常
的
吗?<
浏览 0
提问于2021-10-06
得票数 0
2
回答
熊猫群移除复制品
、
、
我有一个
数据
帧
(df)1 2 202 4 303 2 15我只想
识别
c列
中
的
最大
值
a = df.loc[df.groupby('b')['c'].idxmax()] a b c1 2
浏览 0
提问于2018-11-23
得票数 1
回答已采纳
1
回答
使用Python将每列绘制为一条线,并按Dataframe每列
的
第一行进行
分组
、
、
、
、
因此,我在第一行有一个包含8年能量值
和
对象类型
的
数据
帧
。我需要绘制所有3000个
按
类型
分组
的
源。3000线,X轴是8年,Y轴是能量。It's yearly energy and the type of source 抱歉,如果有什么遗漏了,这是我
的
第一个问题。我尝试只
删除
类型
和
绘图,而不是
按
以下
条件
分组
: blazar_eneryg_with_type.
浏览 40
提问于2020-09-11
得票数 0
回答已采纳
1
回答
使用时保留元素为0
的
行。groupby().sum()
、
、
、
我有一个
数据
帧
,其中包含各种日期
和
该日期
的
相应
值
。我尝试
按
周对
数据
进行
分组
并
对该周
的
值
求和,对于第15周
和
第16周,没有
数据
(正如预期
的
那样),因此当我对
数据
进行
分组
并
求和时,得到
的
数据
帧
不包含第15周
和
第16周。我想生成
浏览 3
提问于2021-07-18
得票数 0
1
回答
在组内计数不同
的
/非唯一
的
、
、
我想在每一组中计算不同
的
元组数: 'b':by='a', columns=['b', 'c']) assert counts == pd.Series([4, 2
浏览 0
提问于2016-09-05
得票数 2
回答已采纳
1
回答
如何从不断变化
的
数据
集中检测
和
消除异常值
、
、
、
、
我有一个
数据
集,其中包含某个对象
的
逐
帧
像素
值
。我
的
代码可以在大多数情况下准确地检测到对象;但是,也有一些缺点。我已经用不同
的
参数尝试了均值
和
中值滤波,我没有得到任何有用
的
东西。有没有办法/算法用正确
的
<e
浏览 1
提问于2015-10-13
得票数 2
2
回答
Pandas groupby检查一列是否严格增加了另一列
的
wrt
、
、
、
我有以下
数据
帧
,df: Subject Marks1 Marks2English 1.5 20English3 40Science 1.5 20Science 3 35 我想
按
主题
分组
,
并
检查Marks2是否严格地随着Marks1
的
增加而增加。如果不是,那么我想从df
浏览 49
提问于2020-06-22
得票数 2
回答已采纳
1
回答
标识具有最高
值
的
组
中
的
行,并提取在Pandas中共享其名称
的
所有行。
、
、
我有一个csv文件,其
数据
排列如下: 0 A Knitting 78 1
和
浏览 0
提问于2016-12-09
得票数 0
回答已采纳
1
回答
在给定行上遇到特定
值
时
的
Dataframe groupby
、
、
、
我有一个
数据
帧
,我想对它进行
分组
(或切片)。A
和
列B上
的
数据
帧
进行
分组
,然后,将每个
分组
按
某个
值
进一步划分为具有连续行
的
较小
分组
。例如,在按列A
和
列B对
数据
帧
进行
分组
后,每当我在列C
中
遇到0时,我希望在第三级上优化
分组
。因此,
分组
的
浏览 3
提问于2017-02-04
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
异常值检测和处理
浅谈离群点检测方法及其应用
机器学习算法原理系列详解-机器学习基础与实践(一)-数据清洗
使用 pandas 进行高效数据分析
SQL常用的基础语法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券