一、当前进度
1、实现任意输入公号抓取
下图以抓取「风巢」、「caozsay」、「小道消息」为例。
2、实现网页自动批量转 pdf
工具: wkhtmltopdf
网址:https://wkhtmltopdf.org/
3、完成 Git 版本控制系统搭建
工具:SourceTree 版本管理软件
网址:https://www.sourcetreeapp.com/
代码托管:Bitbucket,可建立无限多私有 Repositories
网址:https://bitbucket.org
二、遇到问题
文章自动化抓取时会报「参数错误」。
文章链接可通过生成的 HTML 目录直接点击打开,用 IDLE 逐个打开也无问题。批量抓取设置延时也未解决。
明天继续尝试,如仍无法解决则考虑换用 Selenium 驱动浏览器方案。
三、其他
最近在刷以下两本书:
领取专属 10元无门槛券
私享最新 技术干货