很多人都有这样的误解:爬虫工作一定需要代理IP才能进行下去。其实并不是,今天我们来看看爬虫在哪些时候不需要使用代理IP。
一、业务量很小
业务量很小的爬虫工作,有时候并不需要使用代理IP就可以完成,比如爬取几百篇文章,用个火车头就轻松完成了;或者对工作效率没有太大的要求,可以模拟人工正常访问速度慢慢的爬。
二、反爬策略弱
有些网站没有反爬虫策略,那么就不需要使用代理IP也可以正常的进行爬虫工作,不过建议还是不要太猛烈了,以免造成网站服务器崩溃;有的网站反爬虫策略非常薄弱,可能不需要代理IP也可以正常的进行爬虫工作。
其实,不管需不需要代理IP进行爬虫工作,都需要遵守规范,不给他人添麻烦,也是不给自己添麻烦,大家好才是真的好。
领取专属 10元无门槛券
私享最新 技术干货