腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >来自测试集的randomForest预测错误

问来自测试集的randomForest预测错误
EN

Stack Overflow用户

提问于 2014-06-30 15:21:41

回答 2查看 1.3K关注 0票数 0

我在randomForest的R包中遇到了一个错误，在我使用Caret将数据拆分成训练和测试之后，当我去预测时，我遇到了错误：

Error in predict.randomForest(randomForestFit, type = "response", newdata =testing$GEN) 
:number of variables in newdata does not match that in the training data

我从完全相同的文件中拆分了训练和测试中的文件。任何数据中都没有N/A或缺失值。下面是我的完整代码，但我不认为其中有错误。我不知道为什么会发生这个错误。任何想法都将不胜感激！

library(caret)
require(foreign)

set.seed(825)
data <- read.spss("C:/MODEL_SAMPLE.sav",use.value.labels=TRUE, to.data.frame = TRUE)
inTraining <- createDataPartition(data$GEN, p = 0.75, list = FALSE)
training <- data[inTraining, ]
testing <- data[-inTraining, ]


library(randomForest)
library(foreach)

start.time <- Sys.time()

randomForestFit <- foreach(ntree=rep(63, 8), .combine=combine, .packages='randomForest')          
                    %dopar% randomForest(training[-201],
                                         training$GEN, 
                                         mtry = 40, 
                                         ntree=ntree,  
                                         verbose = TRUE, 
                                         importance = TRUE, 
                                         keep.forest=TRUE, 
                                         do.trace = TRUE)

randomForestFit

predict = predict(randomForestFit, type="response", newdata=testing$GEN)

stopCluster(cl)
end.time <- Sys.time()
time.taken <- end.time - start.time
time.taken

random-forest

数字工厂场景解决方案

帮助企业实现数字化、智能化，解决企业工厂内设备数据采集、设备指标分析、企业信息系统间数据孤岛打通、数据应用困难的问题

回答 2

Stack Overflow用户

发布于 2014-07-02 08:24:39

没有数据，任何人都很难确切地说出问题所在。

三点建议：

首先，检查SPSS文件中是否有数据中的杂乱字符。

其次，检查read.spss中的选项是否正确设置: reencode = NA，use.missings =to.data.frame。您可以使用后一个选项来指定要转换为NA的非数字字符。

第三，使用str(df)，useNA=(df，“如果有”)，并确保包括响应在内的因子变量实际上是因子。将as.numeric(as.character())应用于数据框中的数值数据，如果数据框中有类似VALUE!，#NA这样的表达式，则会生成NA值。

您也可以从SPSS导出到csv，然后再次执行上述操作。

票数 0

Stack Overflow用户

发布于 2020-05-17 09:38:03

密钥如下所示

:number of variables in newdata does not match that in the training data

因此，我猜测训练数据和测试数据是不同的，特别是列名。也许它会在这条线上断掉？

inTraining <- createDataPartition(data$GEN, p = 0.75, list = FALSE)

为了更好地理解这个问题，您可能需要发布3行训练和测试数据集(带有列名！)。

我希望这能帮到你!

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/24493556

复制

WPF 将 docx 的 Word 文件转换为 FlowDocument 显示

wpf xml https 网络安全

在 Office 文档解析文档格式和协议咱可以了解到 Word 文档只是一个压缩文件里面的文件使用 xml 表示

林德熙

2020/08/07

1.6K0

Word 神器 python-docx

python 正则表达式 https vba

前两天有个朋友向我求助，她在写毕业论文时，不小心将论文里的中文双引号替换为英文的了，各种原因导致无法回退，8万多字的论文，眼看就要交了，该怎么办？

纯洁的微笑

2020/04/01

2.9K0

用golang在服务端将html转为word（docx）尝试

html 网站

我用goquery+github.com/unidoc/unioffice来尝试一下。

hotqin888

2019/12/20

8.3K0

python-docx操作word文件（

python https 网络安全

document.add_paragraph()之后，默认paragraph的内容到第一个run中。

py3study

2020/01/17

1.5K0

python_docx制作word文档

python https 网络安全

Python可以利用python-docx模块处理word文档，处理方式是面向对象的。也就是说python-docx模块会把word文档，文档中的段落、文本、字体等都看做对象，对对象进行处理就是对word文档的内容处理。

py3study

2020/01/15

3.1K0

Python-Word模板填充-docx

python

docxtpl 按指定的word模板填充内容安装 pip install docxtpl 示例 from docxtpl import DocxTemplate data_dic = { 't1':'燕子', 't2':'杨柳', 't3':'桃花', 't4':'针尖', 't5':'头涔涔', 't6':'泪潸潸', 't7':'茫茫然', 't8':'伶伶俐俐', } doc = DocxTemplate('tpl.docx') #加载模板文件 doc.render(data_dic) #

py3study

2020/01/16

2.8K0

Python 向word（docx）中输

python

如果python2安装后不能使用（找不到包），建议直接使用python3，安装代码如下

py3study

2020/01/06

5090

SharePoint下利用DocX组件导出Word

开源

平常开发时，或多或少都需要和Word打交道，特变是编辑、导出Word。利用DocX，开源的读写Word组件,可以快速帮助我们进行对Word的操作。 DocX官方网站：http://docx.codeplex.com/ DocX主要功能在文档中（Word）插入，删除或者替换文本,支持所有的标准文本格式，如字体{Family,Size,Color},出体，斜体、下划线、高亮等。提供段落属性，你可以设置其对其方向，如从左到右，居中对齐等。 DocX同样支持对图片的操作、超链接、表格、页首、页眉等。最

用户1161731

2018/01/11

1.5K0

HTML转word_怎么把docx转换成word

html javascript 正则表达式 https 网络安全

使用 html-docx.js、FileSaver.js 、wordexport文件

全栈程序员站长

2022/11/04

4.2K0

HDFS——如何将文件从HDFS复制到本地

node.js hadoop java http 编程算法

复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。

星哥玩云

2022/06/30

7K0

word批量doc转docx格式-python

面向对象编程 python html

今天想要实现一个功能是将word内容转换成HTML，查看了网上的代码，还是比较简单的，python中的PyDocX类库可以实现功能。但是存在一个问题，就是word2003版本文档后缀是.doc，在后期版本中后缀是.docx。PyDocX只能处理后缀为.docx格式的文档文件。那么就需要将其进行转换。

申霖

2020/03/24

2.2K0

python读取word详解【from docx import Document】

文件存储 python ide

python读取word详解【from docx import Document】

红目香薰

2022/11/30

1.9K0

使用python-docx模块读写word文件

python

word文档的自动化处理是一件比较头痛的事情，因为深耕于windows操作系统，对于跨平台需求的word文档编辑，是非常痛苦的一件事。在python的生态环境中，提供了python-docx这个模块，可以方便的进行跨平台的word文档处理，但是只适合word 2007以后的文档，即后缀为docx的文档。

生信修炼手册

2020/12/11

1.6K0

Python将md批量转为docx

python markdown

这两天写毕业论文, 发现了一个可以将markdown快速转为word格式的小工具pandoc, 非常好用, 比如我有一个名为毕业论文.md的文件, 我只需在命令行运行 pandoc 毕业论文.md

zhaoolee

2018/06/14

1.3K0

【c#搬砖记】用Docx导出word格式的docx文件

开源 asp

DocX开源网址：http://docx.codeplex.com/ 1、引入DocX.dll 调用ReplaceText()方法替换模板中的字符。只支持docx格式的word文档 using (DocX docx = DocX.Load(fileDemo)) { docx.ReplaceText("@某某某", tester.name); docx.ReplaceText("@110101198101010001",

阿炬

2018/05/11

1.6K0

初探JavaScript PDF blob转换为Word docx方法

html api https 网络安全

PDF 转Word 是一个非常非常普遍的需求，可谓人人忌危，为什么如此普遍的需求，却如此难行呢，还得看为什么会有这样的一个需求：

葡萄城控件

2021/10/21

3.1K0

Python提取docx格式Word文档中所有尾注

docx word 程序

1、用Word或WPS打开一个docx格式的文档，在文档中单击要插入尾注的位置，然后依次单击菜单，如下图所示。

Python小屋屋主

2020/07/16

9110

CKEditor使用

javascript https jquery ui 网站网络安全

https://ckeditor.com/ckeditor-4/download/

码客说

2022/09/19

2.5K0

python网络爬虫文档读取-微软Word文档和.docx

windows server xml python http

大约在2008年以前，微软Office产品中的Word用.doc文件格式。这种二进制格式很难读取，而且能够读取word格式软件很少。为了跟上时代，让自己的软件能够符合主流软件的标准，微软决定使用Open Office的类XML格式标准，此后新版Word文件才与其他文字处理软件兼容，这个格式就是.docx。

用户7886150

2021/01/15

1.4K0

点击加载更多

相似问题

理解枕叶卷积

列表理解卷积

如何理解卷积模型

理解Caffe卷积层

理解卷积层的形状

活动推荐

图片生成与编辑，新用户19.9元起！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问来自测试集的randomForest预测错误
EN

数字工厂场景解决方案

回答 2

Stack Overflow用户

Stack Overflow用户

理解枕叶卷积

列表理解卷积

如何理解卷积模型

理解Caffe卷积层

理解卷积层的形状

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问来自测试集的randomForest预测错误EN

数字工厂场景解决方案

回答 2

Stack Overflow用户

Stack Overflow用户

理解枕叶卷积

列表理解卷积

如何理解卷积模型

理解Caffe卷积层

理解卷积层的形状

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问来自测试集的randomForest预测错误
EN