首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

特征工程系列学习(一)简单数字的奇淫技巧(下)

让我们看看在监督学习中对数转换如何执行。我们将使用上面的两个数据集。对于 Yelp 评论数据集, 我们将使用评论的数量来预测商户的平均评级。对于 Mashable 的新闻文章, 我们将使用文章中的字数来预测其流行程度。由于输出是连续的数字, 我们将使用简单的线性回归作为模型。我们在没有对数变换和有对数变换的特色上,使用 Scikit Learn 执行10折交叉验证的线性回归。模型由 R 方评分来评估, 它测量训练后的回归模型预测新数据的良好程度。好的模型有较高的 R 方分数。一个完美的模型得到最高分1。分数可以是负的, 一个坏的模型可以得到一个任意低的负评分。通过交叉验证, 我们不仅得到了分数的估计, 还获得了方差, 这有助于我们判断两种模型之间的差异是否有意义。

02

制作一个《天使降临到我身边》的随机图片API

俗话说的好:“百合三连,彻夜难眠。” 《天使降临到我身边》这部百合番我并没有看完,就到wikipedia上找到了官网http://watatentv.com 然后就开始抓图片了http://watatentv.com/story01.html 每集6张,一共70张。 预览图: 难度:十分简单 这次我并不用之前一个一个复制文件的方法,还是从Sakura主题cover目录中提取了1个文件,就用它来做随机图片吧。 这次不用找图床,直接找个免费虚拟主机(如果你主机带宽够大可以搭建到你自己服务器上),我用的是https://infinityfree.net/ 建议用它的子域名,然后再建一个,最后搭建API。 把ftp工具准备好,然后到后台获取ftp用户名密码还有服务器。

04
领券