击上方
“蓝色字”
可关注我们!
今日分享:数据集
一:数据集划分
机器学习一般的数据集会划分为两个部分:
1、训练数据:用于训练,构建模型。(大家有时也会看到把训练数据划分为训练集和验证集,这往往发生在模型需要交叉验证时,目的是为了寻找更为合适的模型参数)
2、测试数据:在模型检验时使用,用于评估模型是否有效
二:sklearn数据集API介绍
简单介绍几个数据集
(鸢尾花数据集)
(数字数据集)
(波士顿房价数据集)
(糖尿病数据集)
三:sklearn数据集划分API介绍
在学习sklearn中的一些模型时,使用自带的数据集比较方便,除此之外还有别的一些常用的数据集,在以后的推文中会逐一介绍
公众号QQ群
扫QQ群二维码进交流学习群
领取专属 10元无门槛券
私享最新 技术干货