马上双十一了, 凑个热闹, 发布一篇重量级的文章。如何抓取微信公众号的文章
一、介绍
研究微信抓取之前, 看过知乎有大神写的比较完善的例子, 受到启发, 才完成了整个微信公众号的抓取。...一、抓取要使用的工具
知乎大神用的是nodejs, post给php处理, 并且github上有的大部分也是用这个方式, 或者纯nodejs的方式, 个人觉得受限太大, 最主要的原因是我不会nodejs..., 一天访问次数不可以超过1300次, 保险点, 最好别超过1000次, 访问太多, 会提示页面无法打开或者操作频繁, 24小时以后自动解封
千万不要用客户端大量访问文章内容页, 会直接造成封号, 知乎大神的方式里...这个是大忌
单个客户端抓取多篇文章的阅读点赞的时间间隔必须超过2秒, 不然会返回unknow error的错误
单个客户端抓取阅读点赞一天不能超过6000, 要不然也会返回错误
三、抓取的基本逻辑
获取到公众号...action=home', re.I).findall(self.req_url):
'''启动一个线程去抓取到的页面中获取到文章列表的处理'''
_thread.append