前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >学了这么久,你知道Python机器学习全流程是怎样的么?

学了这么久,你知道Python机器学习全流程是怎样的么?

作者头像
小小科
修改2020-08-07 17:55:10
9490
修改2020-08-07 17:55:10
举报
文章被收录于专栏:北京马哥教育

万事开头难,首先Python机器学习整个流程的第一步就是学习Python这门编程语言的相关基础知识。

第一步:基本 Python 技能

如果要使用 Python 进行机器学习,拥有对 Python 有基础的理解非常关键。幸运的是,Python 是当前普遍使用的流行语言,并纳入了科学计算和机器学习的内容,所以找到入门教程并不困难。在选择起点时,很大程度上要取决于你之前的 Python 经验和编程经验。

这里推荐几本python入门必读书籍:

别再说你不知道怎么学习Python了,13本书给你安排的明明白白!

第二步:机器学习基础技能

KDnuggets 的 Zachary Lipton 指出,人们对数据的认识千差万别,这实际上是对机器学习领域的反映。数据科学家在不同程度上使用计算学习算法。要建立和使用支持向量机模型,熟知核函数方法是否是必需的?答案当然不是。就像现实生活中的许多事情一样,所需要的理论深入程度与具体的实际应用有关。获取对机器学习算法的深入理解不是本文的讨论范围, 而且这通常需要在学术领域投入大量时间,或者至少要通过密集的自学才能达到。

好消息是,你不必拥有博士级别的机器学习理论能力才能进行实践,就如同不是所有程序员都必须接受计算机理论教育才能写好代码。

关于机器学习基础技能,我的建议是去系统的看一些课程。但这时候不需要看完全部的课程,比较好的策略是边练习边学习,在实战中不断推进,需要的时候查阅一些课程进行巩固。

第三步: 从网站通过API挖掘和抓取数据

一旦理解了Python的基础知识和最重要的模块,你必须要学习如何从不同的源收集数据。这个技术也被称作网页抓取。传统的源是网站文本,通过API进入twitter或linkedin一类网站得到的文本数据。接着这个文本数据必须要转换为数值数据,通过自然语言处理(NLP)技术完成。这时候就需要进入实战项目了,学着使用一些Python的基本命令以及网页抓取技术的学习。

第四步:正式进入Python高级机器学习

“分类”也可以称作监督学习,有助于分类图片,用来识别图片中的特征或脸型,或者通过用户外形来分类用户,并给他赋不同的分数值。“聚类”发生在无监督学习的情况,允许用户在数据中识别组/集群。“回归”允许通过参数集估算一个值,可以应用于预测住宅、公寓或汽车的最优价格。

有关Python机器学习的书籍,我特别推荐《Machine learning in action》。尽管有点短,但它很可能是机器学习中的经典,这两本书帮助你通过抓取数据建立机器学习。最近关于机器学习的出版物大多都是基于模块 scikit-learn 。由于所有的算法在模块中都已实现,使得机器学习非常简单。你唯一要做的事就是告诉 Python ,应该使用哪一个机器学习技巧 (ML-technique) 来分析数据。

最后进入实战,利用Python语言及其工具包当做核心工具进行一些实战案例。这里推荐十个Python机器学习竞赛实战案例,详见:

https://wx7dcc75bb5e655e9b.h5.xiaoe-tech.com/content_page/eyJ0eXBlIjozLCJyZXNvdXJjZV90eXBlIjo4LCJyZXNvdXJjZV9pZCI6IiIsInByb2R1Y3RfaWQiOiJwXzVmMjc4MjkzZTRiMDgyMmQyNjg3ZTdmNyIsImFwcF9pZCI6ImFwcHJoS0FBSTNWNjYwMyJ9

完整源码和安装包可关注微信公众号:Python头条。

我不敢保证Python机器学习是速成的或简单的。但只要投入时间,按照流程步骤一步步学习,你无疑会对于这个领域拥有足够的熟练度和理解,会使用流行的 Python 库实现许多机器学习算法,甚至当今深度学习领域的前沿内容。

文章转载于马哥教育官网!

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第一步:基本 Python 技能
  • 第二步:机器学习基础技能
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档