前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习中如何选择合适的模型?-ML Note 61

机器学习中如何选择合适的模型?-ML Note 61

作者头像
讲编程的高老师
发布2021-03-03 11:17:24
7460
发布2021-03-03 11:17:24
举报
文章被收录于专栏:讲编程的高老师

本文是吴恩达《机器学习》视频笔记第61篇,对应第6周第3个视频。

“Advice for applying machine learning:——Model selection and training/validation/test sets”

01

笔记

本视频主要讲解两个问题:(1)模型选择问题;(2)样本数据集的处理,在上节视频的基础上将样本集更细分为训练集、验证集、测试集三类。

本节实质上还是讲如何通过样本数据找到一个适合于解决对应问题的算法模型。

还是说过拟合

如果用多项式拟合,对训练集的拟合效果很好,但往往意味着很差的泛化能力。就是越是好看的花架子,实战可能越差。

那到了实际问题时,如果采用多项式拟合,最高要选择多少次方?如下图的1到10次方。

代表模型选择的参数

那,如果想用一个算法来选择这个多项式的最高次幂,我们可以把这个最高次幂也设计为一个待求解的参数d,那么对应的每个d的取值都会有一组多项式的系数参数\theta,对应的每个模型也会有一个测试误差函数。如下图:

那求解最好模型的问题,也就变成了求解上图中最小测试误差的问题。比如最后可能d=5最好,那对应的五次多项式的拟合结果即是所求。

上面所说的就是模型选择的基本思路。

一个例子

还是卖房子的例子(面积_平方英尺和价格),样本集分成训练集、验证集、测试集(6:2:2的比例进行切分)

对应的误差函数如下图:

上图中的三个函数实际上是一回事,只是参与运算的样本不一样而已。

面对模型选择问题时,我们将可能的模型的最小误差函数都给求出来,先是用训练集训练各个模型的参数,然后用验证集找出最好的那个模型,最后再用测试集来进行测试。有些情景是验证集和测试集用的同一个子集,但是不建议这样做。

02

视频

http://mpvideo.qpic.cn/0bf2q4b22aadeyaowsvog5pvhb6dvwdqhlia.f10004.mp4?dis_k=53788e08999ca197fd33ded30191e985&dis_t=1614741415&spec_id=MzAxMDYwMTc4Nw%3D%3D1614741415&vid=wxv_1603886049120813058&format_id=10004

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 讲编程的高老师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 还是说过拟合
  • 代表模型选择的参数
  • 一个例子
相关产品与服务
图像处理
图像处理基于腾讯云深度学习等人工智能技术,提供综合性的图像优化处理服务,包括图像质量评估、图像清晰度增强、图像智能裁剪等。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档