仰望星空,脚踏实地
保持一颗沉静的心
一步一步向前走
去发现生活中的日常点滴
去探索生活中的美丽风景
去积累生活中的思思感悟
去沉淀生活中的浓郁芬香
今天及今后的几篇文章,探长将通过一个实例和大家一起探讨数据分析的流程,在这里探长将从数据的获取开始,进而对数据清洗、数据分析及可视化进行案例分析。
Part 0 - 项目概览
数据获取、数据清洗、数据分析及可视化是数据分析流程的三大步骤,在本次项目中探长将以手机为分析对象,通过多维度的数据分析了解当前手机市场概况;
今天探长将首先从数据分析流程的第一步-数据获取进行展开,后续会对获取到的数据进行清洗、分析及可视化。
Part 1 - 数据获取维度
由于手头上没有现成数据,探长制定了数据采集策略--通过爬虫技术从网站上进行数据采集,同时探长确定了数据采集来源--某东网站数据,并且明确了数据采集的维度,本次主要获取两个维度数据-产品数据和店铺数据。
Part 2 - 采集结果
通过利用python编写爬虫程序(应用到requests、beautifulsoup、pandas),探长最终获取到3000条左右数据。
Part 3 - 资料获取
为方便大家交流探讨,请在公众号输入窗口中:
回复“手机代码”获取爬虫源代码;
或添加“探长微信”获取爬虫源码文件和结果数据。
Part 4 - 总结
以上就是撰写手机行业数据分析报告的前提--数据的获取,探长希望能够帮助到你!如有任何问题,欢迎与探长联系(在探长交流-->学习交流中可以加探长微信),或者进行留言互动!
茫茫人海中 期待与你相遇 在你我最美丽的时刻
领取专属 10元无门槛券
私享最新 技术干货