Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >14种机器学习常见算法分类汇总!

14种机器学习常见算法分类汇总!

作者头像
CDA数据分析师
发布于 2018-02-05 08:32:48
发布于 2018-02-05 08:32:48
2.2K0
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。这里总结一下常见的机器学习算法,以供您在工作和学习中参考。

机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。

学习方式

根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。

监督式学习:

在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)

非监督式学习:

在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。

半监督式学习:

在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM.)等。

强化学习

在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning)

在企业数据应用的场景下, 人们最常用的可能就是监督式学习和非监督式学习的模型。 在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数据, 目前半监督式学习是一个很热的话题。 而强化学习更多的应用在机器人控制及其他需要进行系统控制的领域。

算法类似性

根据算法的功能和形式的类似性,我们可以把算法分类,比如说基于树的算法,基于神经网络的算法等等。当然,机器学习的范围非常庞大,有些算法很难明确归类到某一类。而对于有些分类来说,同一分类的算法可以针对不同类型的问题。这里,我们尽量把常用的算法按照最容易理解的方式进行分类。

回归算法:

回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法。回归算法是统计机器学习的利器。在机器学习领域,人们说起回归,有时候是指一类问题,有时候是指一类算法,这一点常常会使初学者有所困惑。常见的回归算法包括:最小二乘法(Ordinary Least Square),逻辑回归(Logistic Regression),逐步式回归(Stepwise Regression),多元自适应回归样条(Multivariate Adaptive Regression Splines)以及本地散点平滑估计(Locally Estimated Scatterplot Smoothing)

基于实例的算法

基于实例的算法常常用来对决策问题建立模型,这样的模型常常先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括 k-Nearest Neighbor(KNN), 学习矢量量化(Learning Vector Quantization, LVQ),以及自组织映射算法(Self-Organizing Map , SOM)

正则化方法

正则化方法是其他算法(通常是回归算法)的延伸,根据算法的复杂度对算法进行调整。正则化方法通常对简单模型予以奖励而对复杂算法予以惩罚。常见的算法包括:Ridge Regression, Least Absolute Shrinkage and Selection Operator(LASSO),以及弹性网络(Elastic Net)。

决策树学习

决策树算法根据数据的属性采用树状结构建立决策模型, 决策树模型常常用来解决分类和回归问题。常见的算法包括:分类及回归树(Classification And Regression Tree, CART), ID3 (Iterative Dichotomiser 3), C4.5, Chi-squared Automatic Interaction Detection(CHAID), Decision Stump, 随机森林(Random Forest), 多元自适应回归样条(MARS)以及梯度推进机(Gradient Boosting Machine, GBM)

贝叶斯方法

贝叶斯方法算法是基于贝叶斯定理的一类算法,主要用来解决分类和回归问题。常见算法包括:朴素贝叶斯算法,平均单依赖估计(Averaged One-Dependence Estimators, AODE),以及Bayesian Belief Network(BBN)。

基于核的算法

基于核的算法中最著名的莫过于支持向量机(SVM)了。 基于核的算法把输入数据映射到一个高阶的向量空间, 在这些高阶向量空间里, 有些分类或者回归问题能够更容易的解决。 常见的基于核的算法包括:支持向量机(Support Vector Machine, SVM), 径向基函数(Radial Basis Function ,RBF), 以及线性判别分析(Linear Discriminate Analysis ,LDA)等

聚类算法

聚类,就像回归一样,有时候人们描述的是一类问题,有时候描述的是一类算法。聚类算法通常按照中心点或者分层的方式对输入数据进行归并。所以的聚类算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。常见的聚类算法包括 k-Means算法以及期望最大化算法(Expectation Maximization, EM)。

关联规则学习

关联规则学习通过寻找最能够解释数据变量之间关系的规则,来找出大量多元数据集中有用的关联规则。常见算法包括 Apriori算法和Eclat算法等。

人工神经网络

人工神经网络算法模拟生物神经网络,是一类模式匹配算法。通常用于解决分类和回归问题。人工神经网络是机器学习的一个庞大的分支,有几百种不同的算法。(其中深度学习就是其中的一类算法,我们会单独讨论),重要的人工神经网络算法包括:感知器神经网络(Perceptron Neural Network), 反向传递(Back Propagation), Hopfield网络,自组织映射(Self-Organizing Map, SOM)。学习矢量量化(Learning Vector Quantization, LVQ)

深度学习

深度学习算法是对人工神经网络的发展。 在近期赢得了很多关注, 特别是百度也开始发力深度学习后, 更是在国内引起了很多关注。 在计算能力变得日益廉价的今天,深度学习试图建立大得多也复杂得多的神经网络。很多深度学习的算法是半监督式学习算法,用来处理存在少量未标识数据的大数据集。常见的深度学习算法包括:受限波尔兹曼机(Restricted Boltzmann Machine, RBN), Deep Belief Networks(DBN),卷积网络(Convolutional Network), 堆栈式自动编码器(Stacked Auto-encoders)。

降低维度算法

像聚类算法一样,降低维度算法试图分析数据的内在结构,不过降低维度算法是以非监督学习的方式试图利用较少的信息来归纳或者解释数据。这类算法可以用于高维数据的可视化或者用来简化数据以便监督式学习使用。常见的算法包括:主成份分析(Principle Component Analysis, PCA),偏最小二乘回归(Partial Least Square Regression,PLS), Sammon映射,多维尺度(Multi-Dimensional Scaling, MDS), 投影追踪(Projection Pursuit)等。

集成算法:

集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的较弱的学习模型以及如何把学习结果整合起来。这是一类非常强大的算法,同时也非常流行。常见的算法包括:Boosting, Bootstrapped Aggregation(Bagging), AdaBoost,堆叠泛化(Stacked Generalization, Blending),梯度推进机(Gradient Boosting Machine, GBM),随机森林(Random Forest)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-09-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
网站建设流程是怎样的?需要看重哪些细节?
网站依托于互联网和智能设备,人们需要在有网络的条件下,使用手机或者笔记本等智能设备访问网站,如今网站的种类变得丰富多彩,包括交友、理财以及购物等各类网站,网站建设流程是什么?网站建设要注重哪些细节?
用户8715145
2021/11/18
5930
读《大型网站技术架构》
《大型网站技术架构》是自己接触的第一本架构知识的书籍,还是在14年时买的实体书,前后读了几遍,颇有所得,后来实体书被朋友借走再没归还,也就没再翻过。
高广超
2018/12/12
1.2K1
如何进行网站建设服务器选择类型?网站必须使用服务器吗?
网站建设需要用到虚拟主机或者服务器,很多人都会选择直接使用服务器,因为服务器的功能比较强大,而且能够有效保证网站建设的稳定性,因而服务器也成为了更多人的不二之选。但是网站建设服务器拥有很多种类型,那么如何进行网站建设服务器选择类型呢?
用户8715145
2021/12/03
4.9K0
大型门户网站建设服务器的选购 大型门户网站怎么搭建
现在不管是小企业还是大企业,都是十分需要一个网站来给用户展示一下企业的形象,毕竟想要提高用户对企业的信任,一个高大上的企业网站也是必不可少。有些企业想做大型的门户网站,这类型的网站对服务器有着极高的需求。下面就给大家分享一下大型门户网站建设服务器的选购。
用户8715145
2021/12/11
3.9K0
建设网站如何选择好的网站服务器 网站服务器怎么选
现在的时代应该属于互联网时代。很多人都想通过介绍网站的方式,从而得到更多人的关注,陌生人的关注多了以后,像一些购物平台,购物网站的消费者,也就会更多。但是如果想要建设一个网站的话,建设网站如何选择好的网站服务器是很多新手都面临的问题。
用户8715145
2021/12/11
10.6K0
建设视频网站需要什么服务器 线路和服务商如何选择
每一种网站所需要的服务器配置都有所区别,像是视频网站,一般的大型视频网站内容和资源比较丰富,而且都是庞大的视频资源,所以对服务器的内存和运行要求就比较高。像是很多大型的视频平台可能都需要使用独立的服务器,以及高内存的配置,这样才能保证用户在访问网站时是流畅的。那么建设视频网站需要什么服务器呢?
用户8715145
2021/11/30
1.5K0
笔记 | 大型网站的特点与设计宗旨
假设服务器宕机了,用户就无法访问 我们就必须保证网站稳定的向用户提供7*24小时不间断的服务 哪怕有服务器节点宕机了,依然用备用集确保服务正常访问
阿凯
2019/11/10
7380
笔记 | 大型网站的特点与设计宗旨
外贸网站建设从何做起?英文外贸网站建设的具体流程
英文外贸网站建设对于服务海外的企业来说非常重要,不仅是公司和产品展示功能的窗口,还是企业进行营销推广的重要载体,但很多企业对英文外贸网站的建设并不了解,接下来小编会告诉你英文外贸网站建设从何做起以及有哪些流程,一起看看吧。
优化猩
2023/03/15
2.5K0
外贸网站建设从何做起?英文外贸网站建设的具体流程
香港服务器网站建设的特点 和国内服务器的区别
服务器的类型是多种多样的,从地理因素上来说有国内服务器和国外服务器,不同服务器各有各地特点。香港服务器也是国内的网站常常使用的一种服务器之一。至于为什么很多国内的网站选择香港服务器,是因为使用香港服务器对于网站建设有很多的方便和好处。下面就来详细说说香港服务器网站建设的特点。
用户8715145
2021/12/01
6.6K0
网站建设怎么选一个好的服务器 服务器有哪些?
网站的服务器的主要功能是存放互联网数据,是网络当中的一个重要硬件设施。对于一个企业网站来说,一个好的服务器对于网站的运行和用户的体验度都是息息相关的。服务器决定了网站是不是可以正常运转,并保持一定程度的稳定。因此,网站建设怎么选一个好的服务器,是很多企业在建设网站之前急需了解的问题。
用户8715145
2021/12/01
2.8K0
个人网站建设如何选服务器 服务器选择有什么标准
建立个人网站需要配备一些配套的硬件设备,服务器就是个人网站建设中重要的硬件设备之一。一个好的服务器除了能够帮助网站创建者把个人网站顺利搭建起来以外,还能够维持个人网站的稳定运行。那么个人网站建设如何选服务器?
用户8715145
2021/12/11
3K0
企业应如何正确选择网站空间服务器
互联网的发展对传统行业、实体店带来了强大的冲击,为了适应时代的发展,不少企业或个人不得不选择搭建网站来维持现有的或新的业务来源。网站建设的好坏直接关乎着企业的成败,所以我们不能在任何一个环节上出现问题。网站建设除了前期的设计、开发,还需要选择合适的网站空间服务器来搭建网站。对于服务器的选择是有其技巧和方法的,倘若选择不当,很有可能为网站带来很大的负面影响。所以,对准备建设官网的企业来说,应该如何正确选择网站空间服务器呢?
悉知科技建站
2020/05/23
6.5K0
企业应如何正确选择网站空间服务器
网站建设的服务器选择标准有哪些?
现在我们都处在网络时代,公司都建立了自己的网站来推广品牌产品。那么,对于网站服务器,你知道多少呢?对于企业网站来说,网站并不代表企业的后期规模,但网站的发展速度、是否安全可靠、网站交易系统停滞等都与服
小洋云
2018/12/04
2.5K0
网站建设的服务器选择标准有哪些?
云服务器IIS网站建设攻略 云服务器可以建设几个网站
大部分情况下,在用户开通了服务器以后就需要进行网站的建设。而此时的网站建设需要大家解析域名并绑定域名,如果不进行这两项操作的话,网站的建设会不成功的,可能在登录以后会出现网站建设中的现象,那接下来就给大家介绍云服务器IIS网站建设攻略。
用户8715145
2021/12/13
18.2K0
大型网站架构演化发展历程
大型网站架构演化发展历程一、大型网站系统的特点二、大型网站的演变过程1. 初始阶段的网站架构2. 应用服务和数据分离3. 使用缓存改善网站性能4. 使用应用服务器集群改善网站的并发处理能力5. 数据库读写分离6. 使用反向代理和CDN加速网站响应7. 使用分布式文件系统和分布式数据库系统8. 使用NoSQL和搜索引擎9. 业务拆分10. 分布式服务三、大型网站架构演化的价值观1. 大型网站架构技术的核心价值是随网站所需灵活应对2. 驱动大型网站技术发展的主要力量是网站业务的发展四、网站架构设计误区
cxuan
2019/06/03
1.1K0
营销型网站建设有哪些技巧?建营销型网站需要注意什么
在进行营销型网站建设的时候,很多企业不知道怎么做,也常常会遇到一些小问题不知道怎么结局,其实营销型网站建设还是有规律可循的,接下来小编为你分享营销型网站建设的技巧及注意事项,一起来看看吧。
优化猩
2023/03/31
1.2K0
营销型网站建设有哪些技巧?建营销型网站需要注意什么
云服务器怎样建设网站 云服务器的优势
网站建设如今对企业已经是必备选项之一了。一个企业一定要有自己的网站,不仅可以扩大企业和产品的影响度,而且网站做得好的话是一种非常不错的营销方式。网站可以自己建设,也可以交给第三方外包制作。如果企业打算自己做网站的话,那么建设网站的流程还是必须要了解到。下面来了解一下云服务器怎样建设网站。
用户8715145
2021/12/02
21.2K0
网站建设需要单独一台服务器吗 服务器怎么选
网站的建设需要做很多的准备工作,不仅是技术层面上的准备,还有硬件设施条件上的准备。硬件设施条件上的准备,其中就包括了服务器的准备。所以很多网站的创建者都会想要了解关于网站建设需要单独一台服务器吗?服务器怎么选?一类的问题,下面就来为大家进行解答。
用户8715145
2021/12/13
3.6K0
建设企业网站需要搭建服务器吗 为什么需要搭建服务器
有很多企业想要通过搭建网站吸引更多的用户,让更多的用户了解到自己的企业。但是有不少的企业就会有这样的问题,建设企业网站需要搭建服务器吗?服务器对于一个网站来说究竟有什么样的作用?下面就给各大企业解决一下这两方面的困惑,让大家更了解和建设企业网站相关的知识。
用户8715145
2021/12/11
6.7K0
虚拟网站建设怎么样 网站建设如何选择虚拟主机
大大小小企业都在建设属于自己的网站,然而就需要找到一个即合适又稳定的空间,当然所以不少人都会采用租用服务器的方式,在网站制作时选择使用好的虚拟主机,可以能节省不少成本,也很方便,还能提高空间性能,下面就来看看,虚拟网站建设怎么样吧。
用户8715145
2021/10/20
4.6K0
推荐阅读
相关推荐
网站建设流程是怎样的?需要看重哪些细节?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档