记录下使用python爬取网页并下载资源的过程....因此考虑在PC上提前下载好部分音频,导出到手机,再切换到一个精简去广告的手机App来听,岂不美哉.
学习英语的网站有不少,也可以提供下载,但一个一个右键另存为就不符合咱程序员的身份了,因此爬虫搞起!...解析网页,提取信息
缺少哪个py库,用pip install xx 来安装
分析与设计
分析过程
人工打开几个目标网页,查看网页源代码来分析下规律,即如何通过主网页,一步步跳转到最终的资源链接....只要点击下载图标按钮,就会切换到另一个网页
分析音频播放器下载按钮的链接,不出意料,是一个js函数,如下:
$(function(){...资源链接即是从播放器下载图标中提取出来的链接中的 mp3=xxx的地址
lrc歌词改下后缀即可
提炼总结
根据提供的主页,通过特定的td标签解析出来每一个演讲的链接,即是一个单独的任务
对每个任务,解析