Python可视化(1),历年中国大学学术排行榜
摘要:最近在朋友圈看到一个很酷炫的动态数据可视化表,介绍了新中国成立后各省GDP的发展历程,非常惊叹竟然还有这种操作,也想试试。于是,照葫芦画瓢虎,在网上爬取了历年中国大学学术排行榜,制作了一个中国大学排名Top20强动态表。
打开dist文件夹里面的exampe.csv文件,放进你想要展示的数据,再用浏览器打开bargraph.html网页,就可以实现动态效果了。
同时,可以看到这是世界500强的大学排名,而我们需要的是中国(包括港澳台)的大学排名。怎么办呢? 当然不能一年年地复制然后再从500条数据里一条条筛选出中国的,这里就要用爬虫来实现了。可以参考不久前的一篇爬取表格的文章:
但是表格需要进行处理,比如删除掉不需要的评分列,增加年份列等,代码实现如下:
可以看到美国是用英文的USA表示的,那么我们可以单独提取出src属性,然后用正则提取出国家名称就可以了,代码实现如下:
10年一共5011行×6列数据。接着,读入该表作进一步数据处理,代码如下:
结果非常好,可以直接作为D3.js的导入文件了。
2.4.1. 克隆仓库文件
大概就是这么一个轮播的情况:
领取专属 10元无门槛券
私享最新 技术干货