腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(5459)
视频
沙龙
1
回答
如何
使用
R
拆分
数据
集
,
使
一列
中
的
值
之
和在
子集
之间
大致
相同
?
r
我在
R
中有一个
数据
集
,如下所示: x <- structure(list(value = c(7.496, 11.073, 11.329, 9.282, 8.748, 12.515, 7.46, 9.189-107L), class = "data.frame") 我想做
的
是将
数据
集
一分为二,这样我就有了两个
子集
,其中value列
的
和
大致
相等。也就是说,x$value
的
和是776.8,所以理
浏览 10
提问于2020-07-06
得票数 0
回答已采纳
2
回答
在
R
中
,
如何
将带有单个逗号分隔字段
的
一条记录转换为多条记录?
r
我在
R
工作。strsplit可以将条目
拆分
成一个
值
向量,但是
如何
使
新记录包含所有
相同
的
其他信
浏览 2
提问于2011-05-04
得票数 1
1
回答
如何
在SAS
中
构建相似的示例?
sas
、
sampling
我有一个大
数据
集
(A)和一个小
数据
集
(B)。它们都有
相同
的
变量。
如何
从小
数据
集中提取样本,
使
每个变量
的
分布与大
数据
集中
的
分布
大致
相同
?因
浏览 1
提问于2022-09-05
得票数 0
2
回答
基于
数据
子集
的
精度评分泛化
classification
、
accuracy
我有一个多类
的
问题,我正在为它构建一个分类器。我有N个总
数据
点我想预测。如果我用n个 有人能给我指一篇讨论这个问题
的
文章,或者提出一个研究
的
公式吗?
浏览 0
提问于2018-09-27
得票数 2
3
回答
如何
根据一个由逗号分隔
的
单元格具有多个
值
的
观察结果,在
r
中
子集
数据
?
r
、
subset
一般来说,我对
R
和编程都很陌生,所以请耐心点。 我有一个非常大
的
数据
集
(100,000+观测)。我想根据某
一列
的
值
对此
数据
集
进行
子集
。我面临
的
问题是,我感兴趣
的
列
中
的
单个单元格可以同时接受多个
值
,所有
值
都由一个逗号分隔。
R
只返回名称列等于“Jon”
的
观测
值
。
浏览 3
提问于2015-04-15
得票数 1
回答已采纳
1
回答
如何
计算两个
数据
集
分布
之间
的
重叠
r
、
integration
、
montecarlo
Hi
如何
计算
R
中
两列(或
一列
的
两个
子集
)
之间
的
重叠面积。请参阅以下示例
数据
: set.seed(1234) Data=factor(rep(c("D1", "D2"), each=200)), weight=round我想知道,
如何
给重叠区域着色并计算重叠系数(OVL),类似于
使用
蒙特卡洛积分here所做<em
浏览 178
提问于2020-11-18
得票数 1
1
回答
如何
为LSTM准备
数据
machine-learning
、
deep-learning
、
time-series
、
lstm
、
feature-selection
我很难思考
如何
准备我
的
数据
集
来训练LSTM。📷我
的
想法是,我需要分解每一行(示例),如下所示:因此,在本例
中</e
浏览 0
提问于2021-02-26
得票数 1
1
回答
如何
在
R
中
使用
函数式代码
r
我在
使用
R
中
的
函数程序包时遇到了困难,我有两个
数据
集
:一个具有物种频率,另一个列出了我
的
物种
的
功能特性。频率
数据
集
有264种列在第一行
中
,27个站点列在第
一列
中
,
数据
集中
的
所有
值
在0-1
之间
。功能特征
数据
集
具有第
一列
列出
的
浏览 4
提问于2015-08-14
得票数 0
回答已采纳
1
回答
用几个月
的
时间构造实验/训练
数据
regression
、
mlp
、
theory
、
experiments
我们
使用
全年
的
数据
来预测一个特定
的
目标variable.The模型,就像
数据
- OneHot编码分类变量- MinMaxScaler - PCA (从15k中选择2000年组件
的
子集
)- MLPRegressor但是,当我们进行ShuffleSplit交叉验证时,所有事情都很糟糕(
r
^2分数超过0.9,错误率也很低),但是在现实生活
中
,他们不会
使用
相同
格式
的
数据
(
浏览 0
提问于2020-02-12
得票数 2
1
回答
根据不同行
中
的
值
之间
的
差异
拆分
数据
框
r
、
split
我不确定我是否以正确
的
方式处理这个问题,但我尝试做
的
是根据
值
之间
的
差异将
数据
帧分成组。例如,
使用
下面的
数据
,我希望对MIN列
中
的
值
之间
的
差值进行
拆分
,因此如果差值大于2,则创建一个
拆分
,在下面的示例
中
,我将得到4个
拆分
的
数据
集
。MIN SE
浏览 0
提问于2013-02-01
得票数 3
回答已采纳
2
回答
Hadoop
中
映射函数
的
输入分割
python
、
hadoop
、
hadoop-streaming
、
hadoop2
、
hadoop-partitioning
这是我在Hadoop
中
的
第一个实现。在地图约简中,我试图实现概率
数据
集
的
算法。在我
的
数据
集中,上
一列
将有一些id( dataset
中
唯一id
的
数量等于集群
中
的
节点数)。我必须根据这个列
值
来划分
数据
集
,集群
中
的
每个节点都应该处理每一组记录。例如,如果集群中有三个节点,对于下面的
数据</e
浏览 1
提问于2014-09-08
得票数 1
回答已采纳
1
回答
对于这个范围很广
的
LSTM模型(
使用
Tensorflow),什么是最好
的
标准化
数据
的
方法?
javascript
、
tensorflow
、
machine-learning
、
normalization
我是机器学习
的
新手,所以我仍然试图把我
的
头脑围绕在概念上,如果我
的
问题可能不够简洁的话,请记住这一点。 我正在建立一个带有LSTM层
的
Tensorflow JS模型,用于时间序列预测(RNN).所
使用
的
数据
集
每隔几百毫秒(随机间隔)点击一次。然而,所产生
的
数据
可以有非常广泛
的
范围,例如所收到
的
大多数
数据
将具有20、40、45等价值。然而,有时这一数值在极端情况下将
浏览 0
提问于2020-01-26
得票数 0
回答已采纳
3
回答
将向量分割成块,
使
每个块
的
和近似为常数。
r
、
optimization
、
mathematical-optimization
我有一个大
的
数据
帧,其中有超过10万条记录,其中
的
值
是排序
的
。例如,考虑以下虚拟
数据
集
我希望创建3组以上
值
(仅按顺序排列),
使
每个组
的
和
大致
相同
。因此,对于上述组,如果我决定将排序
的
df按以下3组划分,它们
的
和将是 1. 1 + 1 + 2
浏览 2
提问于2017-09-26
得票数 8
回答已采纳
2
回答
数据
集
随机样本上超参数整定
的
缺点
machine-learning
、
bigdata
、
sampling
、
hyperparameter-tuning
我经常
使用
非常大
的
数据
集
,在构建机器学习模型时检查所有相关
的
超参数组合是不切实际
的
。我正在考虑随机采样
数据
集
,然后
使用
该示例执行超参数调优。然后,我将
使用
所选
的
超参数
使用
完整
的
数据
集
来训练/测试模型。 这种方法
的
缺点是什么?
浏览 0
提问于2019-01-16
得票数 1
回答已采纳
4
回答
如何
在
R
中找到两组
数据
的
p
值
?
r
、
p-value
对于
R
来说,我有两个
数据
集
,它们有
相同
的
x轴
值
,但是y轴是不同
的
。 我想找出两者
之间
的
联系。当我用
R
通过散点图绘制ablines时,它给了我两条最适合
的
线,它似乎
使
一个
数据
集
比另一个
数据
集
更高--但我真的很想知道这两个
数据
集
之间
的
p
浏览 5
提问于2014-03-26
得票数 0
回答已采纳
2
回答
XGBOOST - train_test_split和手动
拆分
的
不同结果
decision-trees
、
xgboost
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=43, stratify=y)📷splitValidationIndex = round(dataset.shape[0]*0.6) spli
浏览 0
提问于2020-02-27
得票数 5
回答已采纳
1
回答
使用
类编码进行预测?
python
、
data-science
、
random-forest
、
one-hot-encoding
我想知道,如果您不知道所有未来
的
特征
值
,是否可以
使用
类编码,特别是Python语言中
的
OneHotEncoder进行预测?然而,当我引入新
数据
时,编码器从未看到过一些位置和‘办公室’。因此,未创建新
浏览 4
提问于2020-06-27
得票数 0
1
回答
取消堆叠另
一列
的
R
DATAFRAME基
值
r
我是stackoverflow
的
新手。目前,我正在尝试
拆分
我
使用
R
在线提取
的
大型
数据
集
。如下所示,有两列,
一列
是ID号,另
一列
具有
值
,在本例
中
是概率
值
ID number; Probability 1 ;x NA ; 0.
浏览 4
提问于2018-09-25
得票数 0
3
回答
如何
正确地将我
的
数据
集中起来
machine-learning
、
deep-learning
、
cnn
、
normalization
在WIKI-IMDB
数据
集
上进行培训时,我计算了火车
集
输入
的
每个通道(RGB)
的
平均值,并从批处理
中
的
每个示例
中
减去它(我还
使用
了
相同
的
方法从我用于早期停止
的
验证集中减去它)。在完成WIKI上
的
网络培训之后,我想在另一个
数据
集
上测试它,它是这项任务
的
基准。我正在测试
的
新
数据
<
浏览 0
提问于2018-06-09
得票数 2
2
回答
VBA宏,它过滤
数据
集
并将其
拆分
为新
的
工作簿。
performance
、
beginner
、
vba
、
excel
此VBA宏
使用
工作表(source_data_worksheet)过滤和
拆分
记录,该
数据
集中大约有十几个唯一
的
列(D)
值
,这些
数据
集
将将保存到文件夹
中
的
工作簿分离。有超过10,000条记录x18列,包括文本和数字(源工作表
的
文件大小约为1.3MB)。过滤变量
的
每个唯一
值
的
记录数从100到5000以上不等。源
数据
集
根据用于筛选
浏览 0
提问于2015-08-20
得票数 7
回答已采纳
点击加载更多
相关
资讯
在R语言中实现Logistic逻辑回归
AI机器学习-决策树-Python实现ID3算法
用Python玩转统计数据:取样、计算相关性、拆分训练模型和测试
R语言笔记6:在R中写一些简单的函数
数据库范式之第二范式
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券