腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
非正态分布
数据
中
保证
采样
数据
的
选择
均值
、
、
我有10000个实例
的
数据
,类似于负二项分布。我正在对这些
数据
进行抽样,但我需要一个正态分布
的
子样本,并具有预先指定
的
均值
。我
如何
才能做到这一点?my_trees)hist(my_sample) mean(my_sample)
如何
对
均值
为25
的
正态分布
数据
进行
采样<
浏览 44
提问于2021-08-26
得票数 1
1
回答
差分进化
的
标准误差
、
、
有可能计算差分进化
的
标准误差吗?Baz
浏览 6
提问于2014-07-05
得票数 2
1
回答
Influxdb使用group by加速长时间查询
我每秒都会将传感器
数据
写入到influxdb
数据
库
中
。在grafana
中
显示每周、每月或每年
的
摘要相当慢,因为它需要查询数千个值。mean(sensor1) into data_avg_1w from data where time > start and time <= end group by time(1w) 这意味着我需要更多
的
存储空间这是一项繁琐
的
工作,还是可以接受
的
,有没有更聪明
的
方法来做这样
的</em
浏览 60
提问于2020-10-20
得票数 0
回答已采纳
1
回答
切比雪夫不等式在R
中
的
应用
、
、
、
我在R中有一个统计问题,我希望使用切比雪夫不等式定理,但我不知道
如何
实现它。例如:想象一个具有
非正态分布
的
数据
集,我需要能够使用Chebyshev不等式定理将NA值分配给落入该分布
的
某个下界
的
任何
数据
点。例如,假设该分布
的
较低5%。这个分布是绝对零
的
单尾分布。我不熟悉
如何
做这件事,也不知道什么样
的
例子可能会有帮助。 如果了解这一点是有帮助
的
,那么这个问题源于大量具有所有不同分布类型
浏览 5
提问于2011-07-21
得票数 1
回答已采纳
2
回答
作为异常检测阈值
的
百分位数?
、
我关注
的
是关于无监督异常检测算法
的
文章。在本文中,使用枕分数百分位数法计算一个阈值,以确定该点是否为孤立点。百分比值和阈值之间
的
联系是什么?我们
如何
确定某个点是一个孤立点,还是不使用一个阈值?
浏览 0
提问于2020-03-10
得票数 0
2
回答
迭代列和示例
我是R
的
新手。我需要对
数据
框
中
的
每一列
采样
10,000次,然后创建包含
选择
1
的
概率
的
新行(我猜它是平
均值
),然后将其绑定到日期框。我知道
如何
创建另一行并将其绑定到原始
数据
框。 但是
如何
分别对列和样本(包括
均值
)进行迭代,然后相应地修改新行呢?语法对我来说有点棘手。
浏览 3
提问于2020-10-26
得票数 2
1
回答
连续三维变量
的
离散化
、
、
、
我目前正在研究具有三维连续变量(x,y,z )
的
机器学习分类问题,我还想添加已经是离散变量
的
时间(T)。下面是我
的
数据
外观
的
一个示例:[0.1 ,2.6, 0.0][0.1 ,2.0, -3.0] [0.0 ,5.6, 5.0] 1486033702474 取每个连续变量
的
平
均值
就足够了吗?请用Python在
浏览 14
提问于2017-02-02
得票数 0
1
回答
C4.5算法是
如何
处理连续
数据
的
?
、
、
、
、
我正在用.net实现,但是我不清楚它是
如何
处理“连续(数字)
数据
”
的
。有人能给我一个更详细
的
解释吗?
浏览 5
提问于2013-03-26
得票数 4
2
回答
为什么bootstrapping技术对我
的
非正态分布
不准确?
、
我
的
代码:population1 <- rpois(1000000, 0.6)mean(sample_bs)我
的
结果Error 所以我<em
浏览 6
提问于2021-07-06
得票数 0
1
回答
使用多个变量对熊猫
数据
帧进行重
采样
、
、
我有一个长格式
的
数据
帧,其中包含几个变量
的
15分钟间隔
的
数据
。如果我应用重
采样
方法来获得日
均值
,我会得到给定时间间隔内所有变量
的
平
均值
(而不是速度、距离
的
平
均值
)。有谁知道
如何
对
数据
帧进行重
采样
并保留两个变量? 注意:下面的代码包含一个长格式
的
示例
数据
帧,我
的
真实示例
从
csv
浏览 19
提问于2021-11-08
得票数 1
1
回答
交叉验证与置信区间
的
关系
、
我从一个来源
中
读到,我忘记了“在交叉验证
中
,
选择
了95%置信区间得分最好
的
模型”。 (1)在抽样手段(而不是抽样分布)<e
浏览 0
提问于2020-06-25
得票数 2
1
回答
postgres读取查询每小时平
均值
的
重新
采样
时间序列
数据
、
、
、
、
我是SQL
的
新手,正在尝试学习
如何
对时间序列
数据
进行读查询。谁能给我一个提示,
如何
在postgres read查询上将间隔时间序列
数据
重新
采样
为小时平
均值
?我
的
表名为building_data,其中有几列名为time, metric, value, kv_tags, m_tags time是我
的
日期/时间戳列,我尝试在其中查看是否可以将value列
中
的
数据
重
采样<
浏览 25
提问于2021-05-11
得票数 0
1
回答
随机
采样
两个向量,找出样本
的
均值
,然后在R中生成矩阵?
、
、
我
的
数据
框架很简单。两列:第一列有基因型(1-39),第二列有性状值(数值,连续)。我想
选择
8个基因型,并计算相关性状值
的
平
均值
和stdev值。最后,我想对8种基因型进行10,000次
的
抽样,而对于每一个样本,我希望得到相关性状值
的
stdev和平
均值
。理想
的
情况是,在矩阵
中
,每一行代表一个样本,每种基因型代表8列,对于stdev和与这些基因型关联
的
特征值
的
平
均值
,
浏览 1
提问于2012-06-05
得票数 1
2
回答
Seaborn tsplot
中
的
“误差带”是
如何
计算
的
?
、
、
我正在尝试理解tsplot
中
的
误差带是
如何
计算
的
。误差范围
的
示例如所示。当我绘制一些简单
的
东西时,比如 sns.tsplot(np.array([[0,1,0,1,0,1,0,1], [1,0,1,0,1,0,1,0], [.5,.5,.5,.5,.5,.5,.5,.5]]顶部误差带也是在y=0.665附近
的
垂直线,底部误差带是在y=0.335附近
的
垂直线。有人能解释一下这些是
如何
派生出来
的
吗?
浏览 3
提问于2015-04-07
得票数 11
1
回答
在R
中
查找
数据
框
中
列
的
平
均值
、
、
我有一个矢量,它包含50个重新
采样
数据
的
数据
帧。因此,每个
数据
框
中
的
所有列名都是一致
的
,但数值不同。每个
数据
帧由12行组成。
如何
找到50个
数据
帧之间特定列
中
每行
的
平
均值
,并将12个平
均值
放入一个新
的
单列
数据
帧
中
?
浏览 2
提问于2017-10-25
得票数 0
1
回答
我们多久看到一次正态分布
的
数据
?
、
然而,在分享我在分析
数据
方面的经验
的
同时,我分析了许多在线来源(网络抓取、在线开放访问
的
数据
源等)
中
的
几个
数据
集,并且有相当多
的
样本(数百,数千)。当我用视觉辅助(直方图,Q-Q图)和夏皮罗-威尔克斯( Shapiro-Wilks )检验
数据
的
分布是否正常时,他们都告诉我
数据
不是正常
的
。因为我在链接上读到
的
文章说 然而,即使个别观测
的
分布不是正态
浏览 0
提问于2018-08-21
得票数 1
1
回答
非正态分布
中
因变量与自变量
的
相关性
、
、
、
、
我
的
数据
集包含100个接受过不同时间(例如,三个月)治疗
的
患者
的
记录。
数据
集如下所示:1 1.2 2.3 3.5 90 58 29 2.1 3.2因子a(假设葡萄糖为
非正态分布
)和因子b(假设治疗或药物为正态分布)已经为每个患者记录了三次。在每个患者
的
访问
中
,也记录了一个指标(例如健康指标)。现在我想知道在三次访问期间,因子b
浏览 1
提问于2018-10-22
得票数 2
2
回答
熊猫.重
采样
.下
采样
前
的
重
采样
、
、
我有一个熊猫
数据
框架,有关于不同时间尺度
的
信息,也就是说,在某些时期,我每秒有100个
数据
点,而在其他时期,我每分钟有一个
数据
点。我
的
目标是用一个固定
的
时间窗口(例如:1秒)对这个
数据
帧进行重
采样
,在上
采样
时使用last进行正则化,使用下
采样
时使用平
均值
。此外,我希望指定算法执行两种操作(下
采样
和上
采样
)
的
顺序,因为我需要先执行过
采样</
浏览 1
提问于2015-09-29
得票数 2
回答已采纳
1
回答
用于平均和直方图
的
时间线
数据
量化
、
、
、
我有一些格式
的
原始电子表格
数据
,如:12/7/2016 3:08:00, 89.10,etc这些
数据
点不是在一个固定
的
间隔内取样,而是在一天
中
随机收集。这使数值在时间线上
的
正确位置,并考虑到不均匀
的
抽样间隔。 我想生成时间线
数据
的
直方图,同时考虑到时间戳,并计算一个时间
浏览 3
提问于2016-12-10
得票数 1
回答已采纳
1
回答
在特征
选择
之前或之后
采样
、
、
、
我对特征
选择
、
采样
和交叉验证
的
顺序感到困惑,我
的
数据
集有468行和23000列,其中269个属于I类,199个属于II类,当拆分训练和测试时,训练.Due
中
的
数据
有215个I类和159个II类,以减少样本数量我不得不对训练
数据
应用或者我应该在这里应用
采样
,这会导致
数据
丢失,从而导致更小
的
样本。I)先应用过
采样
,然后应用特征
选择
技术,然后进行交叉验
浏览 133
提问于2020-08-12
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数字化进程中,如何保证数据安全?
Elasticsearch 如何保证写入过程中不丢失数据的
大数据:从错误的角度出发 如何从数据中获得价值?
从ETL到数据集成,企业应该如何选择大数据技术?
如何保证区块链数据不被篡改的?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券