腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
尝试
在
测试数据
集
上
使用
model.matrix
函数
、
、
我一直
在
尝试
对数据运行一个岭模型。我首先组合了测试和训练数据,并进行了一些数据清理,然后将它们分离,并
使用
训练
集
提出了将其应用于
测试数据
的
函数
。,我分离了两个数据
集
。
model.matrix
函数
时,它会返回矩阵。但是,当我
在
测试数据
上
尝试
它时,它给出了一个包含所有变量的空行。x <-
model.matrix
(SalePrice~., tr
浏览 30
提问于2020-01-18
得票数 0
1
回答
R logistic回归
model.matrix
、
、
我是R的新手,我正在
尝试
理解逻辑回归的解决方案。到目前为止所做的一切是删除未
使用
的变量,将数据拆分为训练和
测试数据
集
。我正在试着理解其中关于
model.matrix
的部分内容。我刚开始学习R和统计学,我不知道什么是
model.matrix
,什么是合同。代码如下:Xdel <-
model.matrix
(delay,fam
浏览 6
提问于2017-08-18
得票数 1
1
回答
神经网络:需要数值/复矩阵/向量参数
、
、
我
使用
包neuralnet
在
R中构建了一个分类模型,但是,我遇到了一个著名的错误:
使用
string)Creating
使用
model.matrix
创建虚拟列(确保没有列是因子,或
使用
步骤1的单热编码数据
集
和在步骤2中创建的公式,由paste functionTraining但是,当我
使用
compute或pred
浏览 9
提问于2020-12-21
得票数 0
回答已采纳
1
回答
R dummy/onehot with具有固定列结构的编码
、
、
假设我的机器学习训练数据
集
包含3列,类别最多为50个不同的级别。我对列进行单热编码。
测试数据
集
只有一行。在对
测试数据
集
进行编码时,如何保持训练数据
集
的结构?v2 <- factor(c("A","A","B","C"))train_dummy <- as.data.frame(
model.matrix</em
浏览 14
提问于2018-12-24
得票数 1
回答已采纳
1
回答
为什么我们
在
R的
model.matrix
函数
中提到-1?这是因为一个热编码,还是有其他原因?
、
、
为什么我们
在
stats包的
model.matrix
函数
公式中提到-1。training_matrix <-
model.matrix
(Survived ~.-1, data = training) 在这种情况下
使用
标准的titanic数据
集
。还有一些文档说,只要我们在数据集中正确地声明了因子和数字,就可以
使用
带有-1表示法的
model.matrix
执行一次热编码。代码如下 data_1_matrix <-
model.matrix</e
浏览 89
提问于2020-11-23
得票数 2
回答已采纳
1
回答
用LARS模型预测
测试数据
时的错误信息
、
、
我
使用
lars模型,并将其应用于具有数值数据和因子的大型数据
集
(75个特性)。mm <-
model.matrix
(target~0+.如果我将它应用于
测试数据
代码toy用一个玩具示例说明了这一点。
在
测试数据
集中,因子不具有"
浏览 4
提问于2015-11-26
得票数 2
回答已采纳
1
回答
关于岭回归-λ的最佳值的质疑
、
我对R中的cv.glmnet()
函数
有一个疑问,该
函数
应该找到岭回归的参数λ的“最佳”值。在下面的示例代码中,如果您
尝试
使用
比cv.glmnet()提供的值小的lambda值,您会发现误差平方和实际
上
比cv.fit$lambda.min提供的值小得多。 我
在
很多数据
集
上
都注意到了这一点。(第6.6.1节
使用
Hitters数据
集
)。最小化MSE的lambda的实际值比ISLR书提供的值要小。
在
训练数据
浏览 1
提问于2017-09-13
得票数 0
1
回答
如何在泰坦尼克号的Kaggle竞赛中
使用
Rs神经网络软件包
、
、
、
我在这个软件包中
使用
R内的神经网络包。以下是来自该网站的列车数据:m <-
model.matrix
( ~ Survived + Pclass + Sex + Age + SibSp我加载
测试数据
并为测试做准备。test=read.csv("test.csv") 预测的
浏览 2
提问于2015-05-21
得票数 3
回答已采纳
1
回答
验证数据中缺少类别
、
、
、
我
在
R中建立了一个基于训练数据
集
的分类模型,其中包含12个分类预测器,每个变量包含几十到数百个类别。 问题是,
在
我用于验证的dataset中,一些变量的类别比
在
培训数据中少。例如,如果我
在
训练数据变量v1中有三个类别-- 'a','b','c',那么
在
验证数据集中,v1只有两个类别-- 'a','b'。
在
决策树或随机森林等基于树的方法中,它没有问题,但在逻辑回归方法(我<
浏览 4
提问于2016-02-16
得票数 2
回答已采纳
1
回答
TreeBagger() (MATLAB)和不同数量的训练和测试
集
上
的变量
、
、
我正在
使用
MATLAB
函数
TreeBagger()进行随机森林分类,以完成一项任务。当
测试数据
的变量数量与训练数据的变量数量不同时,它会给出错误。我被告知,变量选择应该只
在
训练数据上进行,而不是
在
测试数据
上
,这样
测试数据
上
就没有偏见。因此,
在
将初始数据
集
(50个变量)拆分为训练
集
和测试
集
后,我对训练
集
执行变量选择(独立性的卡方检验)。因此,训练<
浏览 0
提问于2015-12-20
得票数 1
1
回答
当我在有因素的列上
使用
model.matrix
时,会添加一个新列
、
、
我想在这个数据集中
使用
这个
model.matrix
函数
。所以我强迫有字符的列成为一个因子列。mydata1$x4 = factor(mydata1$x4,labels = c("1","2","3"))但是当我
使用
model.matrix
函数
时,输出有五列。来自现有数据
集
的列x4被拆分为x42列和x43列。我哪里出错
浏览 3
提问于2016-02-01
得票数 0
回答已采纳
2
回答
运行glmnet()的大矩阵
、
、
、
我有一个问题,运行glmnet lasso与广泛的数据
集
。我的数据有N=50,但p> 49000,所有因素。因此,要运行glmnet,我必须创建一个公式,但当我调用
model.matrix
(
model.matrix
,data)时,我就会用完内存,其中公式=类~。作为一个工作示例,我将生成一个数据
集
:for(i in 1:50) { x = rep(letters[2:8], 7000rep('B', 15)
浏览 2
提问于2013-06-11
得票数 20
回答已采纳
1
回答
如何通过r中的
model.matrix
()传递变量
、
我正在创建一个
函数
来执行交叉验证和岭回归来为模型选择预测器。我的
函数
的输入是dataframe和期望的结果变量outcome (所预测的内容)。我
使用
model.matrix
()来创建一个x矩阵,并将其传递给glmnet()。我的
函数
在
model.matrix
()中
使用
model.matrix
作为对象参数,但是看起来outcome是通过
model.matrix
()传递的错误数据类型。通常
使用
浏览 2
提问于2018-04-13
得票数 1
回答已采纳
2
回答
预测时手动设置新因素水平的系数
我有一个线性模型,其中一个自变量是一个因子,我试图
在
包含新的因子水平(不在估计模型的数据集中的因子水平)的数据
集
上进行预测。我希望能够通过手动指定将应用于该因子的系数来
使用
新的因子级别对观察值进行预测。例如,假设我估计了三种类型商店的日销售量,并在数据集中引入了第四种类型的商店。如果我
尝试
对新数据应用predict.lm(),我会得到一个错误,告诉我因子有新的水平(这是有意义的)。然而,考虑到我正在
使用
的真实模型有许多变量和交互项,并且我希望能够通过更改模型公式轻松地
在
各种模型规范之间循
浏览 4
提问于2013-08-19
得票数 7
1
回答
为什么R中的
model.matrix
()中的数据不被识别?
、
、
、
我想知道为什么在下面的
函数
中,我
使用
带有CO2的基本R数据
集
Plant作为其数据列之一,我会得到以下错误:} #
浏览 1
提问于2018-03-23
得票数 1
回答已采纳
1
回答
将28级范畴变量转换为矩阵
、
、
、
、
我有一个有一列公司的数据
集
,我将对这个数据
集
进行回归建模。当lm
函数
能够处理它时,将它转换为28列有什么相关性?
浏览 0
提问于2017-07-22
得票数 1
回答已采纳
1
回答
R
model.matrix
设置
我有一个数据
集
,我在其中
使用
model.matrix
()
函数
将因子变量转换为虚拟变量。我的数据有10列,每个列有3个级别(2,3,4),我已经分别为每个列创建了虚拟变量。xFormData <- function(dataset){ mm1<-
model.matrix
(~ factor(dataset$type_last1), data
浏览 1
提问于2012-02-13
得票数 5
回答已采纳
1
回答
在
R中
使用
model.matrix
函数
拟合主成分分析
、
、
所以我正在处理一个数据
集
,它包含了泰坦尼克号上乘客的数据,你可以
在
here
上
找到。 因此,我在这里
使用
提供的训练数据。我想创建一个只包含数字(没有因子!)的数据
集
的模型矩阵。通过
使用
model.matrix
函数
。 之后,从该数据集中删除幸存的变量。 从这个矩阵中,我想将PCA拟合到上一步的矩阵中,绘制观察结果的分数(仅
使用
前2个维度),并根据幸存变量对它们进行着色。我已经
尝试
了几种方法,但它似乎不准确,也没有颜色。M
浏览 37
提问于2019-02-07
得票数 0
2
回答
确保训练
集
和测试
集
的
model.matrix
列数相同
有没有一种方法可以确保模型矩阵对于训练和测试
集
具有相同的列数?我
尝试
了以下几种方法: library(tidyverse) cat_vars <- x[1, ] %>% select_if(is.factor(~., x_ent)x_mat_pr x_mat_pr %>%dim() 如果我不
使用<
浏览 15
提问于2020-12-19
得票数 0
1
回答
基于支持向量回归的时间序列预测:欠拟合
、
、
、
我有一个由60个数据点组成的时间序列数据
集
。我把数据
集
分成两部分:培训(前70%的数据)和测试
集
(最后30%的数据)。利用Matlab的fitrsvm
函数
,
在
训练数据
集
上
建立了支持向量回归模型,并对
测试数据
集中的时间序列数据进行了预测。我的svr模型非常接近训练数据
集
。然而,它甚至没有
尝试
泛化
测试数据
集
,它只是严重地不适合于数据,即给出一条直线,甚至不经过
测试数据
浏览 1
提问于2019-01-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
微软继续尝试在Windows上强制使用Edge,现在使用Outlook和Teams
TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)
机器学习基础Python训练集测试集分割与交叉验证
基于TensorFlow和Keras的图像识别
手把手:用Python搭建机器学习模型预测黄金价格
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券