写在前面
本文是上一篇文章《
数据解读高校分布情况与各省高考难度,河南考生要坚强
》的技术实现讲解。
在上一篇文章的开头,我提到了文章中展示的数据并不是通过爬虫抓取的,而是我使用Sublime+正则表达式手工清洗的。
部分数据可视化也没有通过编程实现,而是使用Excel完成的;当然,代码实现会稍微方便一点,但是二话不说就写代码可能对于新手不太友好。所以我这次没写代码就是想要给初学的朋友们说:
不是非得会爬虫才能抓取数据,不是非得编程才能做可视化。
好了,下面就开始讲解实现吧。
01
本文要实现的功能
条形图:
饼图:
02
数据的获取
本次数据的来源网站是高考帮:
获取的高校数据如上图所示,合计有2600余所高校,处理过后的数据保存格式如下:(每个学校为一行,保存在Excel中)
那么,不写代码的情况下如何以最快的速度提取这些数据呢?
请参考下面的视频。
视频时长22分钟,二胖建议大家跟着视频动手操作一遍。
如果视频不清晰,或者目前没有时间观看。
二胖已经将高清视频及处理好的数据上传至百度云盘
链接在留言区,需要的同学请自取。
看完视频,学会了么?
如果有同学没有安装Sublime或者不知道怎么使用Sublime,二胖已经把相关资料链接上传百度云盘,链接请于留言区自取。
03
数据的可视化
二胖之前的文章都喜欢用Python来做可视化,而这次使用的是Excel。
为什么这次要使用Excel呢?
主要有两个原因:
在数据量较小的情况下,Excel比写代码要快很多。但之前的文章中有些数据量达到了百万级,Excel就有点吃不消了。
想要告诉一些朋友,其实Excel在数据处理中也扮演着很重要的角色。
本文要讲解的可视化成果已经在文初介绍了,下面就来看看是如何实现该成果的吧。
本次视频不是由二胖录制,是由小姐姐录制,支持一下吧。
视频看完了,相信你已经学会了如何制作简单的可视化图吧。
这也只是Excel功能的冰山一角,希望大家持续学习。
写在最后
在工作中,对于一个问题,我们应当选择以最快最容易的方法解决;
在学习中,我们应当抱着一颗追根朔底的心。
数据可视化亦如此。
为了节约大家的时间,全量数据我已经处理好放在了百度云盘中,除此之外,本文中的两个高清视频、Sublime安装文档我也一并打包啦!
资源在留言区,请自取。
领取专属 10元无门槛券
私享最新 技术干货