首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >机器学习中集成技术的几个问题

我正在学习合奏机器学习,当我在网上阅读一些文章时,我遇到了两个问题。

1.

在这个文章中,它提到

相反,模型2在所有数据点上可能具有更好的总体性能,但在模型1更好的一组点上性能更差。其想法是将这两种模式结合起来,使它们表现最好。这就是为什么创建样本外预测有更高的机会捕捉不同的区域,其中每个模型的表现最好。

但我还是搞不懂,为什么不训练所有的训练数据才能避免这个问题呢?

2.

在这个文章中,在预测部分中,它提到

简单地说,对于给定的输入数据点,我们所需要做的就是把它传递给M基础学习者,得到M个预测数,然后通过元学习者发送这些M预测作为输入。

但是在训练过程中,我们使用k个-fold训练数据来训练M个基本学习者,所以我是否也应该根据所有的训练数据来训练M个基本学习者,以供预测?

EN

回答 2

Data Science用户

回答已采纳

发布于 2018-04-17 00:57:05

相反,模型2在所有数据点上可能具有更好的总体性能,但在模型1更好的一组点上性能更差。其想法是将这两种模式结合起来,使它们表现最好。这就是为什么创建样本外预测有更高的机会捕捉不同的区域,其中每个模型的表现最好。

这不是关于所有数据的训练。两种模型都对所有数据进行了训练。但它们在不同的点上都比其他的好。如果我和我的哥哥想猜出一首歌的确切年份,我会在90年代的歌曲中做得更好,而他在80年代的歌曲中会做得更好--这不是一个完美的类比,但你明白了--想象一下我的大脑不能处理80年代的歌曲,而他的大脑不能处理90年代的歌曲。最好的办法是让我们都知道我们每个人都对输入空间的不同区域有了更好的了解。

简单地说,对于给定的输入数据点,我们所需要做的就是把它传递给M基础学习者,得到M个预测数,然后通过元学习者发送这些M预测作为输入。

K-折叠仍然只是一个学习者。但是,您正在多次训练,以选择参数,以尽量减少左折叠错误。这就像只训练我学习所有的歌曲,向我展示k-1倍的数据,我尽可能地校准我的内部模型.但我还是不会很擅长那些80年代的歌曲。我只是一个基本的学习者,其功能形式(我的大脑)不适合这些歌曲。如果我们能把第二个学习者带来,那就会改善情况。

票数 3
EN

Data Science用户

发布于 2018-04-17 00:51:08

1-集成方法的思想是最大限度地减少方差,这意味着“过度拟合”。它背后的想法是,我们训练不同的模型(在本例中是2个模型),这些模型不需要看到所有的训练数据点,所以它不会过分适合它(通常称为打包方法)。现在对于预测,我们可以投票给分类问题,或者回归问题的平均值,甚至是一个完整的学习者。这将确保模型在培训和测试阶段是稳定的。

因此,如果我们对所有的训练数据进行训练,我们可能会得到过度拟合,从而降低测试用例的准确性。

2-看看这个:为什么同时使用验证集和测试集?

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/30401

复制
相关文章
边缘计算点燃跨行业的创新革命
从制造业、农业、医疗保健到网络优化、工作场所安全和零售业,边缘计算在各行业领域应用的可能性几乎是无限的。通过减少对云计算平台的依赖,可以加快数据传输,提高敏捷性,降低成本,并支持下一代创新。
静一
2022/12/08
9210
python多行注释和跨行字符串
3》三个单引号(或三个双引号)也可以表示跨行字符串,如: >>> s=''' ... hello ... python ... ''' >>> s '\nhello\npython\n'
py3study
2020/01/07
2.7K0
跨行求职数分的面试经验 + 未来职业规划
这周刚结束一家公司的 3 轮面试,拿到了数据分析岗的 offer。虽然岗位没变,但是在有一年gap year 和跨行求职的前提下拿到的 offer 。
猴子数据分析
2023/09/06
2420
跨行求职数分的面试经验 + 未来职业规划
那些0基础跨行当程序猿的人,是怎样找到工作的?
最近,小N老师收到不少小伙伴的留言,咨询的话题中不少同“转行学开发”有关。 这个话题透露着年底求职的焦虑——对目前的工作薪酬不满意,想从事IT行业的开发工作,又不知道0基础的自己该从何学起。 一方面是工作机会的诱惑,另一方面是技术知识的短板。 正巧,小N老师刚好收到一枚NEXT学院的一位优秀学员的实反馈,聊了一下有关他跨界转行的经历—— 学员:严皇 经历:通过学习NEXT学院课程(前端学位课、小游戏开发课),从电商平面设计师转行做小程序开发 竞争中的机遇 我和NEXT学院的起源,要从一个月黑风高的夜晚
腾讯NEXT学位
2018/12/04
6740
那些0基础跨行当程序猿的人,是怎样找到工作的?
vue+element实现表格跨行或跨列合并
vue+element用于pc后台管理系统比较多,所以后台管理系统一般以处理数据为主,数据结构的复杂程度变高,相对应的前端展示成本也提高, 有些产品经理或许会要求表格跨行或跨列合并,如果你正在想怎么实现,那就接着往下看 最新封装了一个表格合并和编辑插件:vue-split-table,戳一戳 效果图
火狼1
2019/04/17
7.9K0
vue+element实现表格跨行或跨列合并
element-ui中el-table的跨行,合并行计算方式
只有第一列合并行,跨行。合并的规则是纵向相邻的连续N行,如果id一致,则合并。
拿我格子衫来
2022/04/10
2.9K0
element-ui中el-table的跨行,合并行计算方式
element-ui中el-table的跨行,合并行计算方式
看到这个需求一开始我以为很简单,表格跨行.跨列,不就是设置rowspan 和colspan。于是我就把这个功能点放到最后来实现了。
拿我格子衫来
2022/03/28
4.3K0
HTML编程-模板生成含有纵向跨行或横向跨列的表格。
平时我们在开发web网页时,经常遇到把数据呈现为表格报告的情况,有时需要跨列合并或跨行合并单元格来让数据更加直观突出更加条理分明。
MiaoGIS
2021/11/16
2.6K0
HTML编程-模板生成含有纵向跨行或横向跨列的表格。
非科班、跨行业的如何走前端这条路?
近日,由于土哥心血来潮,在知乎上回答了一些前端入门方面的问题,导致很多同学关注了我的公号,以及添加了我的私人微信。
闰土大叔
2019/03/14
7540
数据库事务系列-MySQL跨行事务模型
说来和MySQL倒是有缘,毕业的第一份工作就被分配到了RDS团队,主要负责把MySQL弄到云上做成数据库服务。虽说整天和MySQL打交道,但说实话那段时间并没有很深入的理解MySQL内核,做的事情基本都是围绕着MySQL做管控系统,比较上层。好在周边都是MySQL内核神级人物,在他们的熏陶下多多少少对MySQL的一些基本知识有一些零碎的记录和模糊的认识,这些基础对于今天整理理解MySQL跨行事务模型非常重要。更重要的,有很多不解的地方也可以向大神请教。
Java_老男孩
2019/12/02
1.6K0
数据库事务系列-MySQL跨行事务模型
说来和MySQL倒是有缘,毕业的第一份工作就被分配到了RDS团队,主要负责把MySQL弄到云上做成数据库服务。虽说整天和MySQL打交道,但说实话那段时间并没有很深入的理解MySQL内核,做的事情基本都是围绕着MySQL做管控系统,比较上层。好在周边都是MySQL内核神级人物,在他们的熏陶下多多少少对MySQL的一些基本知识有一些零碎的记录和模糊的认识,这些基础对于今天整理理解MySQL跨行事务模型非常重要。更重要的,有很多不解的地方也可以向大神请教。
星哥玩云
2022/08/18
1.2K0
数据库事务系列-MySQL跨行事务模型
小程序跨行跨列多列复杂表格实现
上面的例子中,最外层一共有4行:基础工资,加班工资,岗位工资,合计。第一层数据的 name 展示为第一列,如果每组数据有 children,取出 children 展示为第二列… 如果 children 长度为0,则直接显示工资数额。
solocoder
2022/04/06
1.9K0
小程序跨行跨列多列复杂表格实现
AI 芯片和传统芯片的区别
比如,自动驾驶需要识别道路行人红绿灯等状况,但是如果是当前的CPU去算,那么估计车翻到河里了还没发现前方是河,这是速度慢,时间就是生命。如果用GPU,的确速度要快得多,但是,功耗大,汽车的电池估计无法长时间支撑正常使用,而且,老黄家的GPU巨贵,经常单块上万,普通消费者也用不起,还经常缺货。另外,GPU因为不是专门针对AI算法开发的ASIC,所以,说到底,速度还没到极限,还有提升空间。而类似智能驾驶这样的领域,必须快!在手机终端,可以自行人脸识别、语音识别等AI应用,这个必须功耗低,所以GPU OUT!
刘盼
2018/12/19
1.6K0
AI 芯片和传统芯片的区别
这是你的芯片!不,这是你的芯片!
清晨6点,沉浸在深深的梦乡里,我追逐着恋人在草地上嬉笑、奔跑、打滚,杠铃般的笑声弥漫了整个梦境......
一斤代码
2018/08/21
5540
这是你的芯片!不,这是你的芯片!
硅光芯片与电芯片的封装
上周中国科协发布了2020重大科学问题和工程技术难题,硅光技术榜上有名,“硅光技术能否促成光电子和微电子的融合?”。这篇笔记聊一聊硅光芯片与电芯片的封装方案。
光学小豆芽
2020/08/27
4.5K0
硅光芯片与电芯片的封装
【HTML】HTML 表格 ③ ( 合并单元格 | 跨行合并 | 跨列合并 | 单元格合并顺序 | 跨行设置 rowspan 属性 | 跨列设置 colspan 属性 )
文章目录 一、合并单元格 1、合并单元格方式 2、合并单元格顺序 3、合并单元格流程 二、合并单元格示例 1、原始表格 2、跨行合并单元格 3、跨列合并单元格 一、合并单元格 ---- 1、合并单元格方式 单元格合并方式 : 跨行合并 : 垂直方向上的 上下 单元格合并 是 跨行合并 , 在 <td> 单元格标签 中 使用 rowspan 属性 , 设置跨行合并单元格数 ; 跨列合并 : 水平方向上的 左右 单元格合并 是 跨列合并 , 在 <td> 单元格标签中 使用 colspan 属性 , 设置
韩曙亮
2023/03/30
9.1K0
【HTML】HTML 表格 ③ ( 合并单元格 | 跨行合并 | 跨列合并 | 单元格合并顺序 | 跨行设置 rowspan 属性 | 跨列设置 colspan 属性 )
【FPGA 芯片设计】FPGA 简介 ( FPGA 芯片架构 | FPGA 芯片相对于传统芯片的优点 )
摩尔定律 : 价格不变 , 在集成电路上 电子元器件的数量 , 18 ~ 24 个月增加一倍 , 同时芯片性能也增加一倍 ;
韩曙亮
2023/03/30
1.9K0
【FPGA 芯片设计】FPGA 简介 ( FPGA 芯片架构 | FPGA 芯片相对于传统芯片的优点 )
✪干货|电信运营商数据价值跨行业运营的现状与思考
作者 | 黄文 一、电信运营商数据资源概况与比较优势 电信运营商作为信息社会的综合信息服务商,拥有天然的数据管道优势,运营商的网络系统与业务平台中数据详细记录了人在现代化社会的信息指纹(如图1)。 图1 电信运营商数据概况 运营商客户的上网和通话行为、位置轨迹等都以BIT的形式流淌在运营商的管道里,而且这些数据是长期积累在运营商的数据管道里的。 因此,电信运营商数据的丰富性、连续性、完整性具有得天独厚的优势,具体来说,运营商数据具有“真、大、快、活、全”五大特点(见图2)。 同时,在跨行业应用领域,
智能算法
2018/04/02
1.9K0
✪干货|电信运营商数据价值跨行业运营的现状与思考
MLP-Like Backbone | Strip-MLP跨行Token交互比SWin Transformer更轻更强的性能
本文首发于 【集智书童】,白名单账号转载请自觉植入本公众号名片并注明来源,非白名单账号请先申请权限,违者必究。
集智书童公众号
2023/09/04
7590
MLP-Like Backbone | Strip-MLP跨行Token交互比SWin Transformer更轻更强的性能
真·富文本编辑器的演进之路-Span开胃菜
https://developer.android.com/guide/topics/text/spans
用户1907613
2021/03/16
2.6K0
真·富文本编辑器的演进之路-Span开胃菜

相似问题

Django测试rest框架: APIRequestFactory与APIClient

12

Django Rest框架APIClient在测试期间不处理异常

31

如何在` `django rest_framework test`的`APIClient`头部添加鉴权token

18

针对查询参数Django REST Framework进行筛选,许多对多

21

Django REST Framework不创建新对象?

22
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档