我刚刚开始写一个简单的网络爬虫来获取我们系统中链接的信息。我使用的是httpclient 4.x。我有大约100个线程运行抓取链接,并在它们上做head请求,它在最初的几个小时内工作得很好,然后它就会变得像爬虫一样尖叫。我不确定我是否正确地设置了连接管理器。下面是创建httpclient对象所需的代码。有没有人看到这个代码块会发出警报?当我停止服务器并重新启动它时,一切都像新的一样。);
final ClientConnectionManager cm = new ThreadSafeClientCon
我正在创建一个行为良好的网络蜘蛛,我注意到一些服务器导致Apache HttpClient给了我一个SocketException --特别是:导致这种情况的代码是:HttpResponse response; response = httpclient.execute(httpget); //httpclient is of t