题图:from Instagram
10 月 8 号那天我发了一个朋友圈,内容是我总结的 Python 数据挖掘的相关内容,我还信誓旦旦地写了个闭关修炼。如今,两个月过去了。里面的每一个分支我还只干完了最基础的 Python 基础相关知识入门。自我欣慰的是,不管怎样,开始了就好,在路上起码比原地踏步让我舒心。
这张大图
那么问题来了,当我们谈论数据分析时,我们在谈论什么?
我们其实在谈论数据分析的三个部分。
1. 数据采集数据采集是我们的「原材料」,主要通过爬虫以及一些自动化工具采集得来。
2. 数据挖掘数据挖掘是数据分析中最有价值的部分,主要是要帮助我们找到数据的规律,帮助我们做出决策,完成业务诉求。
3. 数据可视化数据可视化可以帮助我们更直白地看到做出的结果,帮助我们理解或者向他人演示。
数据挖掘是数据分析的重中之重,每个人的差异和价值也体现在其中。
下面我列出数据挖掘的知识清单,供大家学习参考。
每一个算法都可能花你很多时间去搞懂,我希望大家可以先去了解下每个算法的基本含义以及作用,这样你才会有更深刻的印象。
留一个思考题,你要开始学习数据挖掘了,你有什么心得体会呢?如果一个淘宝店家要查看店铺商品之间的关联关系,他应该用那个算法呢?为什么?
自学很艰难,有一万个诱惑让你很难坚持。多少个日子,我不想总结近日所学内容,我不想写文章,写出来后几经易稿,最终文稿还是躺在我的草稿箱里。为啥?因为有些话我感觉我说出来不够分量,但那个底层逻辑是很多人不会去思考和重视的。
最后推荐大家一个学习方法:MAS 方法。
1. Multi-Dimension,从多维度看问题。
2. Ask,不懂就问,大胆一点。
3. Share,分享的过程也是一种总结。
领取专属 10元无门槛券
私享最新 技术干货