记录下使用python爬取网页并下载资源的过程....因此考虑在PC上提前下载好部分音频,导出到手机,再切换到一个精简去广告的手机App来听,岂不美哉.
学习英语的网站有不少,也可以提供下载,但一个一个右键另存为就不符合咱程序员的身份了,因此爬虫搞起!...如常见的标签tag,CSS中的class
爬虫相关的库.
urllib. 提供接口来打开网页,下载资源
BeautifulSoup....,即是一个单独的任务
对每个任务,解析js中window.open后跟的链接,即是最终的资源所在;分别下载mp3和lrc即可
伪码
main_url = "xxx.html"
for td_tag in..._爬虫基础
BeautifulSoup4.2.0中文文档