人工智能、机器学习和深度学习,已成为能够给我们工作、生活和思维带来变革的认知和科技。
面对海量数据,利用人工智能、机器学习和深度学习创造价值是一件既有挑战又有意义的事情。
本文探讨如何学习和应用机器学习这个主题。
找个合适的理由,告诉自己为什么要学习和应用机器学习。 机器学习是非常有用的,Jeremy Howard先生在TED做了一个演讲《how machine learning is changing this world.》,Jeremy分享了机器学习的许多应用和深度学习,同时讨论机器学习影响世界的几种方式。
选择一门能够快速实现和应用机器学习的语言,R或者Python是个不错的选择,建议择其一学习和应用,至于如何选择,可以阅读这篇文章:《which is better-R vs python》 关于R和Python这块,首先学习它们的基础知识、数据结构和常用库;然后就是根据具体问题利用R或者Python实现机器学习解决问题。
统计学是研究和应用数据的学科。 学习基本的描述性和推断性统计,对数据理解、数据准备和数据建模,都是有必要的。
R和Python与统计学相关的库。 R:stats Python
对原始数据的特征工程和数据清洗质量是一个专业机器学习人士和普通机器学习人士的主要区别。 垃圾进,垃圾出。 这个阶段是需要花费大部分时间和精力的。 如何做数据探索、清洗和准备,可以阅读这些文章
机器学习知识的各种资源非常丰富,请选择适合自己的学习方式。 两门经典课程,推荐择其一,深入学习和理解。
认真地学习完其中一门课程,对机器学习基本知识、常用算法和典型应用有一定的认知。
当你不知道怎么想和做时,请先看看别人是怎么想和做的,吸收别人的精华,提升自己的认知。 kaggle的一个经典的案例: 《Titanic: Machine Learning from Disaster》
机器学习的进阶领域:集成模型、深度学习和大数据机器学习
集成模型 “三个臭皮匠,胜过一个诸葛亮”
深度学习 深度神经网络,自动提取有效特征
大数据机器学习 大数据之大,一是样本数之大,二是特征数之大,这两大给机器学习带来新的挑战和机遇。
实践出真知! 场景+数据+算法 = 引爆点