前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >最佳机器学习入门级资源

最佳机器学习入门级资源

作者头像
青蛙跳
发布2018-02-05 15:48:46
1.2K0
发布2018-02-05 15:48:46

这是一篇非常难写的文章,同时我希望这篇文章对于入门学习的朋友是真正有价值、有帮助的。

起初,关于这个问题,我脑子其实是一片空白的。我在想图书馆里的书、课程资料、论文、书籍哪个更加适合推荐给机器学习领域的入门初学者。

期间,我很纠结应该减掉、增加哪些内容。我努力把自己置身于程序员和初学者之中,从他们的角度思考哪些资源最有利于他们学习“机器学习”。

我精心挑选最好的资源。如果你真的是一个初学者,并且极其希望在机器学习领域有所耕耘,希望你能从中找到一些对你有帮助的知识。我的建议是专注于一项资料,一本书或一个编程库,并反复阅读其中涵盖的知识、教程。选择一样,坚持下去,一旦你已经掌握透了,再换一本书,反复阅读这本书。让它融入你的知识储备。

编程库

我认为,对于一件事应该学到可以构成威胁为止,再开始小试身手。

这就是我学习编程的方法,我相信很多其他人也是这样学习的。了解你的局限性,充分利用你的优势。如果你知道如何编程,可以利用它来快速深入了解“机器学习”。在你开始操作之前,应该先进行大量的训练,学习数学相关知识。

找到一个编程库,阅读文档,按照教程,开始尝试。以下是最好的开源机器学习编程库。它们并非都适合在你的生产系统中使用,但它们是很好学习资源,你可以从中学习、探索、研究。

你可以从一个熟悉的语言库开始,然后转到其他更强大的编程库。如果你是一名优秀的程序员,相信你可以很容易地在各种语言之间切换。它们的逻辑是相同的,只是在语法和API上略有不同。

  • 用于统计计算的“R项目”(R Project):这是一个环境和lisp脚本类似的语言。所有你想做的统计资料将被提供给R,包括一些测绘。CRAN上的机器学习类(第三方机器学习软件包)代码由该领域的领先人物编写,以及任何你能想到的东西。如果你想快速研究和探索,那么必须学习“R项目”。因此,你也可以从学习“R项目”(R Project)开始。
  • WEKA:这是一个提供API的数据挖掘工作台,包含用于整个数据挖掘中所需的大量命令行,它也具有图形用户界面。可以用于准备数据,可视化探索,构建分类,回归和聚类模型,许多算法都内置在第三方插件中。如果您是大数据和机器学习的新手,请坚持使用WEKA并坚持一次学习一样东西。
  • Scikit Learn:基于NumPy和SciPy构建的Python中的机器学习。如果你是一个Python或Ruby程序员,这是你的图书馆。这是友好的,功能强大,并提供优秀的文件。如果你想尝试别的,橙色将是一个很好的选择。
  • Octave:如果你熟悉MatLab或者你是一个NumPy程序员寻找不同的东西,可以考虑Octave。这是一个像Matlab一样的数值计算环境,可以很容易地编写程序来解决线性和非线性问题,比如大多数机器学习算法的基础问题。如果你有工程背景,这可能是你开始的好地方。
  • BigML:也许你不想做任何编程。您可以完全不用编程就可以像WEKA一样驱动工具。您可以进一步使用BigML等服务,在Web上提供机器学习界面,您可以在浏览器中浏览构建模型。

选择一个更适合自己的平台,用它进行“机器学习”实际学习。不要仅停留于学习表面,还要实际操作哦!

视频课程

很多初学者都很喜欢通过视频进行初步学习。

我在YouTube和VideoLectures.Net上观看了很多“机器学习”相关视频。但是有些人只是简单的看看视频,这并不是一种高效的学习方法。我建议在观看视频的时候应该记笔记,也可以对照视频自己演练一遍。

坦白说,我所见过的大多数视频课程都不太适合初学者。这些视频实际上都包含了线性代数和概率论的相关知识。

在我看过的视频中,Andrew Ng在斯坦福大学的讲座视频,很适合推荐给初学者。

论文概述

如果你不习惯阅读、研究论文,第一次阅读论文时,你会发现字里行间的语言非常僵硬。一篇论文就像是教科书中截取的片段,但它描述了一些实际情况。如果想要开始学习“机器学习”,你可能会在其中发现一些有趣的论文。

我只列出了两篇重要的文章,因为阅读文章可能会让你失望。

初学者机器学习书籍

有很多机器学习书籍,但为初学者编写的书籍却很少。

什么是真的初学者?

最有可能的是,你来自另一个领域,但现在开始学习“机器学习”,那些领域可能是计算机科学,编程或统计学。即使如此,阅读大多数书籍都需要至少有线性代数和概率论的知识基础。

有一些书鼓励程序员从通过算法的基础部分开始,并指向工具和库,以便可以开始尝试。

最值得推荐的是 编程集体智能(Programming Collective Intelligence)黑客机器学习(Machine Learning for Hackers)数据挖掘(Data Mining):分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请阅读这三本书中的任意一本!

机器学习初学者的书籍
机器学习初学者的书籍
  • 编程集体智能:构建智能Web 2.0应用程序(Programming Collective Intelligence: Building Smart Web 2.0 Applications):本书是为程序员编写的。这本书不侧重于理论,重在代码示例和实际的网络问题、解决方案。买它、读它、做练习。
  • 黑客机器学习(Machine Learning for Hackers):我推荐在阅读 编程集体智慧(上文)之后,再学习这本书。它也提供了实用的实例,但它更多关于数据分析,以及使用R。我真的很喜欢这本书!
  • 机器学习:一个算法的角度(Machine Learning: An Algorithmic Perspective):这本书就像编程集体智慧的更高级版本。它有类似的内容(让机器学习开始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果对这本书有兴趣,我建议学习编程集体智慧(Programming Collective Intelligence)后阅读。
  • 数据挖掘:实用机器学习工具和技术,第三版(Data Mining: Practical Machine Learning Tools and Techniques, Third Edition):我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这条路。
  • 机器学习(Machine Learning):这是一本很老的书,包括公式和大量的参考文献。也是一本教科书,但对于每种算法都有很好的解释。

虽然很多人都有在讨论、推荐一些很棒的机器学习教科书,但很多都不适合初学者。

更生层次的阅读

我深深地思考了这个问题,我也去看了其他人的清单。

为了完整起见,下面是网络上一些关于机器学习入门的大量资源清单。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 编程库
  • 视频课程
  • 论文概述
  • 初学者机器学习书籍
  • 更生层次的阅读
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档