我有一个问题,机器人爬行移动网站,并返回在移动网站上的桌面用户点击。移动内容在/ mobile /常规站点将移动用户重定向到/ mobile / site常规桌面浏览器,允许进入/ mobile / site,并将看到移动版本(用于从桌面轻松测试移动内容)。我希望这两个爬虫索引洞网站,但只有移动爬虫应该索引移动网站。这样可
我正在努力创建一个Java的网络爬虫。爬虫访问网站,使用JDBC访问/存储数据库中的数据,还将文件存储在本地或云存储上。作为爬行的一部分,我想记录爬虫使用的确切细节--Number of sites visited (HTTP+HTTPS)
Number of bytes of data received当爬虫执行某些操作(如访问网站、下载数据等)时,我是否需要在每个阶段单独记录以上所有参数??我不希望程序仅仅因为我想测量和跟踪上面的参数而陷入困境。我希望使用爬虫作为桌面