通过python的requests和lxml库,完成对模板之家免费模板的查询和下载功能(保存本地)
工具:python3.6 requesst、lxml库
以上2个库都可以通过pip安装,在cmd下输入命令:pip install requests(lxml),然后等待安装完成即可(如果报错,也可以网上搜索whl文件,下载到本地安装)
整体思路:
l 查找目标网站的分类和相应的url,写入字典待查
l 等待用户输入查询分类,返回对应的url
l 找到分类的最大页码,做入循环
l 找到每个模板url,进入后查找下载地址url
l 建立用户输入分类文件夹,保存模版至文件夹
大致如此,接下来我们分析网页
最大页码查找
下载地址所在
分类函数,传入名字,返回url:
完整代码和运行结果如下(头部信息请自行输入):
最后
这个网站很简单,不需要登录验证码,不需要cookies,爬虫也没有写的太暴力,注意加上间隔时间,别对人家服务器造成压力最好。
喜欢就关注下呗!
领取专属 10元无门槛券
私享最新 技术干货