在看到这篇文章的时候,大家是不是都还停留在对python爬虫的迷恋中,今天就来教大家怎样使用微软的Excel爬取一个网页的后台数据,注:此方法只适用于对爬数据感兴趣但却不会使用Python之类的工具进行爬虫的人,用Excel爬取网页数据,方便、容易上手,但是局限性很大,它只能爬去单个网页的数据,并且受网页数据的排版影响,如果网页排版不适合爬取的话则需手动更改格式。
在这里我们以爬取空气质量排行网页为例:
首先新建一个Excel表格,打开数据,自网站,出现提示框,将我们要爬取的网站辅助粘贴至搜索框点击搜索
第四步进入网页,可以看到数据如图所示,这时我们点击导入按钮:
点击导入之后先别着急点确定,点击属性,修改我们将会用到的一些常用属性:
请看下图
刷新控件设置在一分钟可以保证更快地数据更替,而打开文件时刷新数据项也保证了我们在打开文件时数据项的最新。其他更改随着自己的需求调整。
最后一步就是点击确认,完美将网页数据下至自己的工作文件中。
怎么样,小伙伴是不是特别方便呢?但是这个只是针对不会python等爬虫高手实用,普通人需要一些数据的时候可以自己下载,也非常的方便哦,欢迎下方留言讨论!
领取专属 10元无门槛券
私享最新 技术干货