腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(638)
视频
沙龙
1
回答
识别
异
常值
并
仅
处理
R
中
groupby
多
列
的
异
常值
?
、
、
我希望通过group by
多
列
来
识别
异
常值
,
并
使用95%和5%
的
值来
处理
异
常值
。我创建了一个函数来
处理
异
常值
,如下所示。H)),"x"] <- caps[1] return(data) } 我试着像下面这样将异
常值
归因于
浏览 10
提问于2020-04-19
得票数 0
1
回答
为大型数据集
的
Excel
中
的
单元格格式编写公式:将离群值变为红色
、
、
、
我有一个大型数据集(2209行x 60
列
)(每
列
都是一种化合物,即臭氧、乙烷等)。我有一种计算异
常值
的
特殊方法。基本上,我已经为50个化合物计算了一个数字,任何大于这个数字
的
浓度(位于每个化合物
列
的
底部)都被认为是异
常值
,我想通过将它们
的
字体设置为红色来
识别
它们。我知道这可以在单元格格式
中
完成,但我必须为每个单独
的
列
执行此操作,这很耗时。我
的
数据
浏览 14
提问于2020-05-26
得票数 0
1
回答
单链接层次聚类-在分支高度上绘制箱形图以检测异
常值
、
、
、
、
在k-means聚类进行消费者细分之前,我希望
识别
并
删除样本
中
的
异
常值
。我尝试了使用单一链接算法
的
层次聚类。问题是,我有一个包含800多个案例
的
样本,并且在我
的
图(单链接树状图)
中
,数字彼此交叉,因此无法读取,因此我不可能
仅
通过查看图表来清楚地
识别
异
常值
:-/ 在这里,他们说,您可以基于分支距离创建箱图,以更客观
的
方式
识别
异
常值
浏览 73
提问于2020-09-07
得票数 0
1
回答
在离群点上有名称
的
多个方格图
、
、
我有一个像这样
的
盒子情节: 之所以显示异
常值
名称,是因为我将第一
列
设置为:现在我想知道如何制作一个新
的
多
盒图。数据仍在幻灯片数据库
中
。这2
列
的
名称是: ski_parc
浏览 1
提问于2012-12-22
得票数 0
回答已采纳
1
回答
在将对比应用于线性模型之前,解决组间
的
不等方差?(
r
)
、
、
我所做
的
:根据
的
建议,我使用来自robust pckg
的
lmRob()创建了一个健壮
的
线性模型,然后应用了对比。ICECAP_A ~ sf1, data = SCI, nrep = Exhaustive) My problem:自那以来,我一直读到稳健回归更适合
处理
异
常值
(
的
底部)这个UCLA页面(以及其他页面)建议sandwich包获得
异
方差一致(HC)标准错误(比如在
中
)。我
浏览 3
提问于2020-02-21
得票数 0
回答已采纳
1
回答
为数据集中
的
每个变量提取异
常值
、
、
我有一个很大
的
数据集,我试图为每个变量获取它
的
离群值,以便过滤掉它们。> dataset$variable <- !dataset$variable %in% boxplot.stats(dataset$variable)$outmap(dataset, boxplot.stats) 它随后为每个变量创建了一个统计数据列表,但我未能从中
浏览 1
提问于2022-08-18
得票数 0
1
回答
如何将聚类分析从SAS (使用ward方法和自动删除异
常值
)转换为
R
?
、
、
、
我试图在
R
中
编码和复制,在SAS中进行聚类分析,包括Ward方法和Trim选项。这个修剪选项自动省略低概率密度点(离群点)。密度用kth最近邻法或均匀核法估计.此选项在聚类分析期间运行。我
的
目标是找到同样
的
聚类方法,包括
R
中
的
这个限制选项,因为我必须用新
的
数据来补充我
的
数据集。因此,我想确定我在
R
中
的
聚类分析是正确
的
,
并
遵循在SAS中所做
浏览 1
提问于2021-06-01
得票数 0
2
回答
异
常值
检测和重命名为NA,使用长格式
的
dplyr
、
我是
R
编程
的
新手,遇到了一个问题。我想要检测数据集中
的
异
常值
,然后将其重命名为"NA“,但找不到正确
的
方法。我使用melt函数将我
的
数据集转换为长格式,然后使用()
中
的
"isnt_out_tukey“函数(1.5xIQR规则)。 结果是一个带有逻辑表达式("TRUE","FALSE")
的
新
列
。但在这个新专栏
中
,我需要保留所有非异
常值
浏览 20
提问于2019-10-26
得票数 0
2
回答
R
异
常值
函数
、
、
、
我有一个删除离群值detectaOutliers()
的
函数,但不知何故,我
的
函数并没有删除所有离群值。 q = quantile(x, probs = c(0.25, 0.75)) OM1 = q[1] -(
R
* 1.5) # outliers moderados OE1 = q[1] - (
R
* 3)
浏览 2
提问于2018-03-21
得票数 1
1
回答
R
中
按
列
和因子删除离群值行
、
、
、
、
我正在使用
R
中
的
一个数据框架,我有以下函数,它移除数据框架df
的
所有行,其中,对于指定
的
列
索引/属性,该行
的
值超出平均值(
列
)加或减n*stdev (of
列
)。(这样它就可以返回整个数据帧,其中
的
行
仅
根据所选属性attr删除)。如果可能的话,我更喜欢避免循环
的
解决方案(除非在基本
R
/dplyr中出现了不可避免且没有更有效
的
方法
浏览 4
提问于2020-05-04
得票数 1
1
回答
R
中
的
时间序列突变/变化/扰动检测:结构变化、转换点、BreakoutDetection、bfast等
、
、
我希望这成为
R
.
中
各种时间序列突破/变化/干扰检测方法
的
标志,我
的
问题是用下面的每一个包描述方法
的
动机和不同之处。也就是说,什么时候使用一种方法比另一种方法更有意义,异同等等。在较小程度上:和 我希望有针对性
的
答案。也许每种方法都有一个段落。很容易跨越时间序列,但这可能是以滥用/违反假设为代价
的
。有些资源为ML监督/非监督技术提供了指导方针。我(当然还有其他人)会欣赏一些关于时间序列分析领域
的
指南
浏览 0
提问于2015-03-23
得票数 10
回答已采纳
1
回答
从
R
中
的
多
列
中
移除异
常值
、
我使用以下代码
识别
不同列上
的
异
常值
:outliers_x4 <- boxplot(mydata$x4, plot=FALSE)$out现在,如何通过一个代码从数据集中删除这些异
常值
?
浏览 0
提问于2022-04-30
得票数 0
4
回答
寻找一套很好
的
时间序列异常检测软件包
、
、
、
、
是否有一个全面的开放源码包(最好在python或
R
中
)可以用于时间序列
中
的
异常检测? 在scikit中有一个支持向量机软件包--学习,但它不是针对时间序列数据
的
。我正在寻找更复杂
的
包,例如,使用贝叶斯网络进行异常检测。
浏览 0
提问于2018-05-24
得票数 24
回答已采纳
3
回答
K-均值将一个数据点分类为一个组。
、
、
我有1000个一维数据集(每个长度为360),我想要k个方法来对每组数据进行一个小/
中
/大值(n_clusters=3)
的
分类,但是我得到了很多这样
的
情况:大组只有一个数据点,因为这个值离其他数据点太远了,但是其余
的
数据看起来可以清晰地创建3个集群。在其他一些情况下,使用1个数据点似乎是有意义
的
,因为其余
的
数据点非常接近。目前还不清楚是否有三个不同
的
星系团。 怎样才是解决这一问题
的
有效方法?
浏览 0
提问于2019-05-17
得票数 3
回答已采纳
1
回答
确定
R
中
每个分量
的
样本方差百分比
、
、
、
我将PCA应用于我
的
生物医学数据(31个基因~行和1904个患者~
列
),选择了9个组件。因此,我有两个子矩阵,其中一个是9乘以1904
的
矩阵(我称之为矩阵A)。矩阵A表示它
的
行是9个分量,它
的
列
是1904个患者,它
的
条目是连续
的
值。现在,我想找出这9个分量
中
的
哪个分量
仅
具有1904名患者
中
的
一个患者,与其他患者相比,该患者
的
方差>10% (
浏览 12
提问于2021-02-07
得票数 0
1
回答
Python统计模型稳健线性回归(RLM)异
常值
选择
、
、
、
我正在分析一组数据,我需要找到它
的
回归。数据集中
的
数据点数很低(~15),我决定使用稳健线性回归来
处理
这项工作。问题是,这个程序选择了一些似乎没有那么大影响
的
离群点。下面是数据
的
散点图,它们
的
影响被用作大小: 点B和C(图中用红色圆表示)被选定为异
常值
,而影响更大
的
点A则不是。虽然A点没有改变回归
的
一般趋势,但它基本上是随着X值最高
的
点来定义坡度,而B点和C点只影响坡度
的
显着性。因此,我<em
浏览 2
提问于2017-11-10
得票数 2
回答已采纳
1
回答
在进行PCA时检测异
常值
、
、
、
我是数据分析
的
新手,
并
试图更好地理解如何在进行PCA分析时
识别
异
常值
。我创建了一个有5
列
的
数据矩阵来表示我
的
变量,包括数学、英语、历史、物理和社会科学;每一行代表学生在课堂上获得
的
最终成绩。当我绘制第一和第二主成分
的
得分时,我
的
数据矩阵
中
的
第五
列
是一个异
常值
。我希望有一种在数学上检测异
常值
的
方法,而不必绘制分数
浏览 2
提问于2014-08-27
得票数 2
回答已采纳
1
回答
使用P5 javascript从图像生成调色板
、
、
、
我被要求从图像
中
识别
出前5个重复
的
颜色。我有下面的代码,由我
的
老师提供 return element.color[0] ==
r
//console.l
浏览 0
提问于2019-11-22
得票数 2
1
回答
如何用NAs来确定至少一个
列
是否满足某一条件
、
、
我有一个包含多个
列
的
dataframe :我需要
识别
其中一些
列
中
至少有一个异
常值
的
行,但我不知道如何
处理
NAs。dataframe
的
一个例子(与我
的
不同):# 1 10 0.5 4# NA NA NA NA NA # 2
浏览 5
提问于2019-11-21
得票数 1
回答已采纳
2
回答
将所有变量嵌入
R
中
的
一个插补函数
中
找到没有异
常值
的
平均值,然后将该平均值用于NA值lq<-quantile(churn.data.frame.2$avg6mou,probs = 0.25, na.rm = TRUE) } 嘿,伙计们,我是
R
的
新手,我有点纠结于把data.frame嵌入到一个函数
中
。我写
的</e
浏览 1
提问于2015-12-27
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas入门3-1:识别异常值以及lambda 函数
数据预处理——数据清洗
在Python中使用PyOD进行异常值检测
Doping:使用精心设计的合成数据测试和评估异常检测器的技术
软件测试笔记|Python编程基础|Pandas 知识精要
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券