腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
从
数据
帧
中
的
列
中
采样
唯一
行
,
而
不
进行
替换
、
、
我有一个dataframe,其中第一
列
包含
唯一
的
行
ID,第二
列
包含
的
值在行之间通常不是
唯一
的
。,
而
不
进行
替换
,以便
采样
数据
中
的
行
具有
唯一
的
行
ID值。duplicated(df_sample$id) [1] FALSE FALSE FALSE TRUE
浏览 7
提问于2019-07-22
得票数 1
回答已采纳
1
回答
重复
行
的
随机抽样
、
、
我有一个包含2
列
的
数据
帧
:
列
1是ID,
列
2是与每个ID关联
的
值(总共59
行
)。[ID] [value] [2] b 167 [4] d 117 我假设我可以
从
第1
列
随机
采样
并将关联值保留在第2
列
的
唯一
方法是对行
进行</e
浏览 1
提问于2018-06-04
得票数 0
2
回答
在spark scala
中
,为
数据
帧
中
的
每个组
采样
不同数量
的
随机
行
、
、
、
目标是为每个组在
数据
帧
中
采样
(不
替换
)不同数量
的
行
。特定组要
采样
的
行数在另一个
数据
帧
中
。 示例: idDF是要从中
采样
的
数据
帧
。组由ID列表示。
数据
帧
planDF指定要为每个组
采样
的
行数,其中"datesToUse“表示行数,&q
浏览 25
提问于2018-03-02
得票数 3
回答已采纳
1
回答
对具有相同代码(ID)
的
条目
进行
重
采样
、
在R
中
,我正在尝试对我
的
数据
集
进行
重
采样
。
数据
库A在第一
列
包含一些代码(整数),每一
行
的
特征如下: A <- as.matrix(cbind(floor(runif(1000, 1,101)), matrix(rexp(20000, rate=我想从第一
列
开始对随机代码
进行
重
采样
,并创建一个新
的
矩阵或
数据
帧
,这样对于重<e
浏览 23
提问于2017-01-26
得票数 2
回答已采纳
0
回答
基于计数列对pandas
数据
帧
进行
下
采样
、
我有一个类似下面的成千上万
的
数据
框架,虽然要大得多(1000000
行
,100
列
)。,我想从这个
数据
帧
中
随机
采样</em
浏览 6
提问于2018-07-11
得票数 4
回答已采纳
1
回答
基于因子
的
样本(具有
替换
)来提取
数据
帧
的
索引
、
、
、
我正在尝试弄清楚如何
从
数据
帧
中
的
因子(
唯一
标识符)
的
唯一
值中
进行
采样
--使用
替换
--然后使用这些(重复
的
)
采样
值来获得要
采样
的
唯一
标识符
的
值
的
索引。更具体地说,假设我有一个(重复
的
)字母和数字
的
数据
集。我希望
采样<
浏览 1
提问于2016-02-04
得票数 2
1
回答
在eval
中
预测错误(expr,环境,附件):在R
中
找不到对象
、
我试着用前面的函数来预测几个模型,但是我得到了“eval
中
的
错误(expr,envir,enclos):object 'var.1‘not”。这很奇怪,因为var.1不在dataframe
中
。
浏览 3
提问于2015-05-27
得票数 2
回答已采纳
1
回答
python
中
的
轮廓系数与sklearn
、
、
我在使用sklearn计算python
中
的
轮廓系数时遇到了问题。下面是我
的
代码:from sklearn.metrics import *X = pd.DataFrameeuclidean',sample_size=int(50))IndexError: indices are out-of-bounds 我想使用sample_size参数,因为在处理非常大
的
数据</em
浏览 1
提问于2013-12-04
得票数 7
回答已采纳
1
回答
通过
替换
迭代更大
的
Bin大小
的
随机样本,bin
列
和聚合
数据
、
、
、
首先,我想要绑定两
列
数据
。入库
的
列
必须彼此相邻(即
列
1和2,
列
5和6,
而
不是
列
4和6)。矩阵
中
开始入库
的
位置是随机
的
。例如,在一个600
列
的
矩阵
中
,入库
的
前两
列
可以是
列
545和546,下一
列
是
列
3和4。我想在没有
替换
的
情况
浏览 36
提问于2019-09-24
得票数 0
回答已采纳
3
回答
如何
从
两
列
中
的
一
列
中
采样
细胞?
我想在我
的
数据
帧
中
定义一个new.column。new.column
从
另外两
列
中
的
一
列
获取值。如果其他
列
在同一
行
中
,则new.column
的
给定单元格应该仅对这些
列
中
的
单元格
进行
采样
。我想要
的
: first.column second.column new.
浏览 10
提问于2019-07-10
得票数 2
回答已采纳
1
回答
Python - Pandas使用字符串和浮点数对
数据
帧
进行
重
采样
、
、
我有一个
数据
帧
,其中
的
索引是一个datetimeindex,每一
行
都是几年中
的
每一天。我需要按月对
数据
帧
重新
采样
,其中两个浮点
列
相加,但字符串列是该月内
的
所有
唯一
值。我可以对单个
列
进行
重
采样
,但我不知道如何对所有
列
进行
重
采样
,或者如果我一次只对一个
列
进行
重<
浏览 25
提问于2021-06-27
得票数 0
回答已采纳
2
回答
随机
采样
两个
数据
帧
中
的
同一位置
、
考虑各自具有N
列
和M
行
的
两个
数据
帧
df1和df2。 我想随机
采样
两个
数据
帧
中
的
相同位置。要在df1
中
对一个位置
进行
采样
,我使用 df1.sample(1,axis=1).sample(1,axis=0) 我想在另一个
数据
帧
中
采样
相同
的
位置。这种
采样
会发生k次
浏览 20
提问于2019-04-15
得票数 0
回答已采纳
1
回答
如何使用
数据
帧
作为pandas
的
权重对
数据
帧
进行
采样
、
、
、
、
我想要根据权重
的
数据
帧
从
数据
帧
的
每一
列
中
采样
行
。权重
数据
帧
的
所有
列
的
总和为1。显然,我希望根据w
的
第一
列
的
权重对A
的
第一
列
进行
采样
,依此类推。使用这样
的
解决方案: sa
浏览 37
提问于2021-06-24
得票数 0
1
回答
随机森林排样置换与特征抽样
的
目的
、
、
在随机森林中,我们实际上使用了引导聚合,实际上,我们遵循两个步骤,比如用
替换
的
行
采样
和创建引导示例
的
特性
采样
,实际上我
的
问题是 1)此行抽样和特征抽样
的
实际目的是什么?2)在带
替换
的
行
抽样
中
,同一
行
可以在引导样例
中
重复(如果我错了,请纠正我),如果同一
行
出现了两次,它将如何影响我们
的
最终预测:是否需要
进
浏览 5
提问于2022-03-25
得票数 -1
4
回答
基于
列
标准
的
Panda Dataframe重
采样
、
、
、
如果另一
列
中
的
单元格与我
的
条件匹配,我希望对
数据
帧
进行
重
采样
'timestamp': [ ], 'Values': [1, 1.5, 2,
浏览 1
提问于2017-01-13
得票数 13
1
回答
绳子被神秘地剪断了
、
、
、
、
在我
的
应用程序
中
,我使用在应用程序运行时提供翻译。该库基本上会维护一个属性列表及其分配
的
本地化关键字,并在活动语言更改时使用DependencyObject.SetValue()更新它们
的
值。我注意到问题
的
场景是这样
的
:我有一个简单
的
TextBlock,并为它
的
Text属性分配了一个本地化关键字。现在,当我
的
应用程序启动时,它会将初始值写入其中,并且它将在屏幕上显示得很好。这两种语言
的
相对长度似乎与此无关。在我<em
浏览 2
提问于2011-11-09
得票数 4
回答已采纳
2
回答
使用
替换
对R
中
的
数据
帧
的
随机行
进行
采样
、
、
我希望能够使用bootstrapping为一些测试统计
数据
生成一些置信区间。我希望能够做
的
是使用原始
数据
集
的
采样
和
替换
来绘制引导
数据
集。我假设这将是一个大小为n
的
数据
集(其中n小于原始
数据
集
的
大小),它从具有
替换
的
完整
数据
集中
采样
观察值/
数据
行
(以便某些
行
可能被绘制
浏览 0
提问于2018-09-11
得票数 0
1
回答
使用Pandas
进行
插值,并使用时间戳
而
不是日期时间字符串存储时间序列
数据
?
、
、
我有一个Pandas
数据
帧
,其中包含一个
从
0开始
的
时间戳
列
。 第一
行
始终
从
time = 0开始,随后
的
行
从
该点开始获取相对时间。因此,例如,第二
行
比第一
行
晚0.25秒,显然它
的
时间戳是0.25。我希望使用时间戳
列
主要是为了能够
进行
重
采样
和插值。因此,据我所知,为了达到这个目的,它必须是与时间相关
的</e
浏览 19
提问于2019-03-12
得票数 0
2
回答
如何
从
给定因子
的
大
数据
帧
中
获得具有代表性
的
样本
、
如果一
列
是一个因子,但
数据
框
的
每个子集都有不同
的
大小--可能一个子集有数千
行
,
而
另一个子集有数万或数十万行--对于特定
的
子集,使用df[sample(nrow(df, n),]
进行
的
采样
可能没有足够
的
行数
采样
的
数据
帧
将在ggplot2
中
转换为抖动图,我希望每个面具有大约相同
的
样本大小。
浏览 1
提问于2014-07-01
得票数 2
1
回答
给定权重(频率)
的
数据
帧
行
的
随机抽样
、
我有以下格式
的
数据
帧
:一
列
包含原始序列,另一
列
显示序列发生次数,其他
列
具有其他特征。DSLIHFEIHDFS", "DOOIUDBD")我
的
实际
数据
框架有超过10^6<em
浏览 1
提问于2018-02-01
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
70个NumPy分级练习:用Python一举搞定机器学习矩阵运算
70个NumPy练习:在Python下一举搞定机器学习矩阵运算
用机器学习分析流行音乐(一):数据收集和清理
pandas系列学习(五):数据连接
如何只用一行代码让 Pandas 加速四倍?
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券