最近在学习机器学习的一些相关的算法,在学习过程中新接触到了大量的概念和原理。为了更好地提高学习的效果,于是就把在学习的过程中接触到的新概念和遇到的问题通通写进我的博客,作为学习笔记,以提供给自己和其他朋友进行查阅和参考。
这篇内容主要是讲述数学模型的模型评估方法,将会对新的概念进行逐一解读。有条件的还会对相关的内容进行拓展资料的整理,其主要内容如下:
经过实验测试,对模型的泛化误差进行评估,选出泛化误差最小的模型。待测数据集未知,使用测试集进行泛化测试,测试误差(Testing Error
)即为泛化误差的近似。
::: warning 需要注意:
概念:讲已知数据集分成两个互斥的部分,其中一部分用来训练模型,另一部分用来测试模型,评估其误差,作为泛化误差的估计。
::: warning 需要注意:
概念:将数据集划分成k
个大小相似的互斥的数据自己,自己数据尽可能保证数据分布的一致性(分层采样),每次从中取一个数据作为测试集,其余用作训练及,可以进行k
次训练和测试,得到评估均值。该验证方法也称作k
折交叉验证(k-fold Cross Validation
)。使用不同的划分,重复p
次,称为p
次k
折交叉验证。
概念:是k
折交叉验证的特殊形式,将数据集分成两个,其中一个数据集记录条数为1,作为测试集使用,其余记录作为训练集训练模型。训练出的模型和使用全部数据集训练得到的模型接近,其评估结果比较准确。确定是当数据集较大时,训练的次数和计算规模较大。
拽着自己的鞋带把自己从湖里提起来. —巴龙伯爵历险记
概念:是一种产生样本的抽样方法,其实质是有放回的随机抽样,即从一直数据集中随机抽取一条记录,然后将该记录放入测试集同时放回原数据集,继续下一次抽样,直到测试集中的数据条数满足要求。
::: tips
要点:
,取极限:
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有