腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5919)
视频
沙龙
2
回答
每组
随机
采样
,
制作
一个
新
的
数据
帧
,
重复
,
直到
一个
组
中
的
所有
实体
都被
采样
、
我想为每个区域
随机
取
一个
站点,创建
一个
新
的
数据
帧
,并
重复
这些过程,
直到
所有
站点
都被
采样
。因此,每个
数据
框不会包含来自相同区域
的
相同站点。在我
的
真实
数据
框
中
,有几个区域比其他区域有更多
的
站点(区域C有4个站点)。我想删除这些行(也许我应该在创建多个
数据
浏览 23
提问于2017-03-10
得票数 2
2
回答
在样例函数
中
,替换意味着什么?
、
当我试图从
数据
帧
中
随机
选择
每组
中
的
10个样本时,我试图找出样本函数是如何工作
的
。 我有
一个
5列7000行
的
数据
框架。我将
数据
集分成大约200个
组
。然后,我想从
每组
随机
抽取10个样本。有些
组
的
样本少于10个。所以当我尝试对它们进行
采样
时,我设置了replace=T,但是当我检查
浏览 0
提问于2019-03-25
得票数 1
回答已采纳
1
回答
重复
行
的
随机
抽样
、
、
我有
一个
包含2列
的
数据
帧
:列1是ID,列2是与每个ID关联
的
值(总共59行)。2列
的
唯一方法是对行进行
采样
。我需要
随机
采样
50 x 1行、50 x 2行、50 x 3行、50 x 4行等等,
直到
59行。理想情况下,每个样本集输出为
一个
数据
帧
。因此,我最终得到了59
组
随机
采样
的
数据</e
浏览 1
提问于2018-06-04
得票数 0
2
回答
在spark scala
中
,为
数据
帧
中
的
每个
组
采样
不同数量
的
随机
行
、
、
、
目标是为每个
组
在
数据
帧
中
采样
(不替换)不同数量
的
行。特定
组
要
采样
的
行数在另
一个
数据
帧
中
。 示例: idDF是要从中
采样
的
数据
帧
。
组
由ID列表示。
数据
帧
planDF指定要为每个
组
采样
的
行数
浏览 25
提问于2018-03-02
得票数 3
回答已采纳
2
回答
每组
随机
抽样,使用min_rows
、
、
我有
一个
数据
帧
,我想对它进行
采样
。然而,在
随机
抽样时,我希望从列
中
的
每个元素
中
至少有
一个
样本。我还希望分布也有影响。(例如:原始样本较多
的
值对
采样
的
df有更多
的
影响)df = pd.DataFrame(columns=['class']
浏览 0
提问于2020-09-09
得票数 4
1
回答
对具有相同代码(ID)
的
条目进行重
采样
、
在R
中
,我正在尝试对我
的
数据
集进行重
采样
。.1), ncol=20) )) 一些代码在第一列
中
重复
。我想从第一列开始对
随机
代码进行重
采样
,并创建
一个
新
的
矩阵或
数据
帧
,这样对于重
采样
的
代码向量
中
的
每一项,它都会提供给我右侧。如果有更多
的
向量具有相同
的
重
浏览 23
提问于2017-01-26
得票数 2
回答已采纳
0
回答
基于计数列对pandas
数据
帧
进行下
采样
、
我有
一个
类似下面的成千上万
的
数据
框架,虽然要大得多(1000000行,100列)。,我想从这个
数据
帧
中
随机
采样</em
浏览 6
提问于2018-07-11
得票数 4
回答已采纳
1
回答
如何保存
随机
欠
采样
的
数据
?
、
、
我试图通过使用多数类
的
随机
欠
采样
来平衡
数据
帧
。它已经成功了,但是,我也想将从
数据
帧
(欠
采样
)
中
删除
的
数据
保存到
一个
新
的
数据
帧
中
。我该如何做到这一点?这是我用来对
数据
帧
进行欠
采样
的
代码 from imblearn.under
浏览 29
提问于2021-08-09
得票数 0
回答已采纳
1
回答
每次我运行与样本相关
的
东西时,Spark都会重新
采样
我
的
数据
、
、
我在
一个
数据
集上运行
一个
分层样本,其中
的
样本保存在
一个
名为df
的
数据
帧
上。在df上运行计数时,每次我运行计数(没有重新运行分层
采样
)时,它会给出不同
的
计数,就好像每次我对df执行操作时,我
的
数据
都会重新
采样
一样。我将种子设置为12,并使用spark函数sampleBy。我是Spark
的
新手,这正常吗?我如何解决这个问题?
浏览 0
提问于2019-03-14
得票数 0
2
回答
python random.sample在出现
所有
可能
的
结果后停止
采样
、
、
我正在使用random.sample对
所有
可能
的
数据
集(大约150
组
)组合进行
采样
。我将测试
的
样本大小为3,4和5,
数据
集
的
范围在2到20个项目之间。d['2-101a-124'] = 0
浏览 0
提问于2011-08-10
得票数 1
回答已采纳
1
回答
数据
帧
中
的
采样
随机
行,其中
采样
数超过行数。分配抽样概率
、
考虑以下示例
数据
,这些
数据
存储在
一个
名为df
的
数据
帧
中
x y1 5如您所见,此
数据
帧
有3行。我想要做
的
是取100个行样本,其中每一行都有相等
的
被选择
的
概率(在本例
中
为1/3)。我
的
输出,让我们称其为df_result,如下所示:x y2 41 5 1
浏览 3
提问于2017-05-19
得票数 0
1
回答
根据因素对
数据
帧
行进行洗牌
、
我有
一个
数据
框架,例如: A 0 55 C 1 12 E 2 68 G 2 187 我希望对每个类
中
的
行进行
随机
采样
,以便将
一个
letter关联到
一个
新
的
随机
valu
浏览 0
提问于2019-01-18
得票数 5
回答已采纳
1
回答
通过替换迭代更大
的
Bin大小
的
随机
样本,bin列和聚合
数据
、
、
、
首先,我想要绑定两列
数据
。入库
的
列必须彼此相邻(即列1和2,列5和6,而不是列4和6)。矩阵
中
开始入库
的
位置是
随机
的
。例如,在
一个
600列
的
矩阵
中
,入库
的
前两列可以是列545和546,下一列是列3和4。我想在没有替换
的
情况下
采样
,这样组合就不会被
采样
两次。聚合被定义为计算bin rowSums()
的
行和。聚合结果将是结果矩阵
中
<
浏览 36
提问于2019-09-24
得票数 0
回答已采纳
1
回答
基于某些条件
的
R自举
我正在尝试基于某些条件对
数据
集进行引导。 下面是我
的
数据
的
快照,顶行是列名。我
的
数据
大约有10k行。v1 00000 0 我想通过
随机
重新
采样
v1来生成
一个
新
的
数据
集,
直到
有
一个
1,并进行观察计数。例如,第一次迭代对
数据
重新
采样
x次,
直到
出现1为止,并记录对<em
浏览 9
提问于2019-12-21
得票数 0
3
回答
如何使用从
随机
抽样
的
另
一个
数据
帧
中
创建
的
重复
列来创建
数据
帧
?
、
、
、
我正在尝试使用从另
一个
数据
帧
中
随机
抽样
的
方式向另
一个
数据
帧
中
重复
添加列。我
的
第
一个
dataframe包含要从其中
采样
的
实际
数据
,如下所示 df <- data.frame(cat = c("a", "b", "c","a",
浏览 26
提问于2020-12-23
得票数 0
回答已采纳
1
回答
具有共享端节点
的
采样
边
、
、
、
我正在tensorflow
中
实现
一个
神经网络训练算法,它需要从图中
采样
神经网络
的
输入,特别是我想要创建从图中获取
的
边
的
小批次,这些边是从邻域区域中
随机
选择
的
-即共享一些端节点。现在,我有
一个
生成器,它从图中
的
所有
边
中
随机
返回一批边。你对如何实现这一点有什么建议吗?我认为应该有一种方法来使用networkx将图划分为相邻边
的
列表,然后从这些划分<e
浏览 0
提问于2017-05-30
得票数 1
3
回答
当样本数量大于总体数量时,如何
重复
采样
而不进行替换
、
这看起来一定是
重复
的
,但我找不到解决方案,可能是因为我不知道到底要搜索什么。 假设我有
一个
装着8个编号
的
弹珠
的
桶,10个人从桶里每人抽取1个弹珠。我如何编写
一个
采样
过程,每个人都从桶
中
抽取一颗弹珠而不进行替换,
直到
桶为空,此时
所有
的弹珠
都被
放回桶
中
,
采样
继续进行而不进行替换?这种抽样有名字吗?例如,使用我们
的
10个人和8个弹珠
的
浏览 23
提问于2020-10-05
得票数 0
回答已采纳
1
回答
随机
抽样
组
,而不是SQL
中
的
行
、
、
、
、
假设我
的
表是这样
的
:|ColA | ColB | ColC || AA C2 | | CC E 5 | 我想从A列而不是行
中
随机
抽样
组
每组
都是
一个
事件序列,我希望每个
组
都有这些事件,这就是为
浏览 4
提问于2021-10-18
得票数 0
1
回答
如何为R
中
的
多个列创建分层
采样
、
、
我
的
数据
集有821049个变量和18列。我想采取9列进行分层抽样。我
的
分层变量是ID = 1:821049。如何选择变量
的
间隔?如何设置
采样
大小?
浏览 22
提问于2020-04-03
得票数 1
1
回答
为了提高效率,在pngs上循环运行ffmpeg?
、
、
、
我使用ffmpeg将生产
数据
作为文本叠加嵌入到另存为png文件
的
动画
帧
中
。目前它
的
效率非常低,因为我需要从动画场景
中
采样
值,如当前
帧
和相机焦距,所以我有
一个
循环,
采样
每一
帧
的
信息,运行ffmpeg来嵌入该
帧
的
文本,然后关闭ffmpeg并
重复
直到
完成。如果我有两个给定
的
字符串列表数组(比如<em
浏览 6
提问于2021-06-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
9 种经典排序算法的可视化,用Python3分钟就可以搞定!
我用Python,3分钟快速实现,9种经典排序算法的可视化
9种经典排序算法的可视化
我用 Python,3分钟快速实现,9 种经典排序算法的可视化
机器学习中样本不平衡处理办法
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券