首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言从入门到精通:Day16(机器学习)

    在上一次教程中,我们介绍了把观测值凝聚成子组的常见聚类方法。其中包括了常见聚类分析的一般步骤以及层次聚类和划分聚类的常见方法。而机器学习领域中也包含许多可用于分类的方法,如逻辑回归、决策树、随机森林、支持向量机(SVM)等。本次教程的内容则主要介绍决策树、随机森林、支持向量机这三部分内容,它们都属于有监督机器学习领域。有监督机器学习基于一组包含预测变量值和输出变量值的样本单元,将全部数据分为一个训练集和一个验证集,其中训练集用于建立预测模型,验证集用于测试模型的准确性。这个过程中对训练集和验证集的划分尤其重要,因为任何分类技术都会最大化给定数据的预测效果。用训练集建立模型并测试模型会使得模型的有效性被过分夸大,而用单独的验证集来测试基于训练集得到的模型则可使得估计更准确、更切合实际。得到一个有效的预测模型后,就可以预测那些只知道预测变量值的样本单元对应的输出值了。

    01

    SVM在脑影像数据中的应用

    如第一章所述,机器学习中有四种基本方法:有监督学习、无监督学习、半监督学习和强化学习。分类是监督学习的一种形式,它根据训练阶段确定的许多输入输出对将输入数据映射到输出数据。使用分类,与一组示例观察相关的特征可以用来训练一个决策函数,该函数以给定的精度生成类别赋值(即标签labels)。从功能性神经成像数据到推特帖子,这些特征可以是多种多样的。一旦基于这些特征创建了决策函数分类器,它就可以使用之前建立的模式自动将类标签附加到新的、不可见的观察结果上。有许多类型的机器学习算法可以执行分类,如决策树,朴素贝叶斯和深度学习网络。本章回顾支持向量机(SVM)学习算法。支持向量机的强大之处在于它能够以平衡的准确性和再现性学习数据分类模式。虽然偶尔用于回归(见第7章),SVM已成为一种广泛使用的分类工具,具有高度的通用性,扩展到多个数据科学场景,包括大脑疾病研究。

    04

    支持向量机1--线性SVM用于分类原理

    在机器学习中,支持向量机(SVM,也叫支持向量网络),是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。是由Vapnik与同事(Boser等,1992;Guyon等,1993;Vapnik等,1997)在AT&T贝尔实验室开发。支持向量机是基于统计学习框架与由Chervonenkis(1974)和Vapnik(1982,1995)提出Vapnik–Chervonenkis理论上的最强大的预测方法之一。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM训练算法创建一个将新的实例分配给两个类别之一的模型,使其成为非概率二元线性分类器。SVM模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

    04

    支持向量机的原理

    支持向量机(support vector machine,简称SVM)是一种基于统计学习理论的新型学习机,是由前苏联教授Vapnik最早提出的。与传统的学习方法不同,支持向量机是结构风险最小化方法的近似实现。这个归纳原理是基于这样的事实,学习机器在测试数据上的误差率(即泛化误差率)以训练误差率和一个依赖于Vc维数(Vapnik-Chervonenkis dimension)的项的和为界;在可分模式情况下,支持向量机对于前一项的值为零,并且使第二项最小化。因此,尽管支持向量机不利用问题的领域知识,在模式分类问题上,仍能提供好的泛化性能,这个属性是支持向量机特有的。其实现的是如下的思想:通过某种事先选择的非线性映射将输入向量x映射到一个高维特征空间z,在这个空间中构造最优分类超平面,从而使正例和反例样本之间的分离界限达到最大。从概念上说,支持向量是那些离决策平面最近的数据点,它们决定了最优分类超平面的位置。

    02

    机器学习三人行(系列七)----支持向量机实践指南(附代码)

    其实逻辑回归算法和今天要讲的支持向量机有些类似,他们都是从感知机发展而来,支持向量机是一个非常强大而且应用面很广的机器学习算法,能够胜任线性分类器,非线性分类器,线性回归问题,非线性回归问题中,甚至是离群值检测中,是应用最广泛的机器学习算法之一,本文剖析支持向量机在实践中的应用。 一、线性支持向量机 我们以一些图来解释支持向量机的基本原理,下图是对鸢尾花数据集分类,可以发现两种花能够很轻松的通过直线划分出来,因为该数据集是线性可分的,左图是三种可能的分类方式,虚线基本没有办法将两种类别划分,另外

    012

    机器学习三人行-支持向量机实践指南

    关注公众号“智能算法”即可一起学习整个系列的文章。 文末查看本文代码关键字,公众号回复关键字下载代码。 其实逻辑回归算法和今天要讲的支持向量机有些类似,他们都是从感知机发展而来,支持向量机是一个非常强大而且应用面很广的机器学习算法,能够胜任线性分类器,非线性分类器,线性回归问题,非线性回归问题中,甚至是离群值检测中,是应用最广泛的机器学习算法之一,本文剖析支持向量机在实践中的应用。 一、线性支持向量机 我们以一些图来解释支持向量机的基本原理,下图是对鸢尾花数据集分类,可以发现两种花能够很轻松的通过直线划分出

    09
    领券