我用java做了一个网络爬虫。它递归地遍历每个页面中的链接。现在我想要得到一个特定页面的点击数。可以通过网络爬虫吗?因为我们不能访问服务器代码,所以我们不能添加任何计数器来计算命中率。请提出任何解决方案。谢谢。
代码的基本结构是:
->获取url的html源代码。->从html代码中找到可访问的链接,并将其放入列表中。->获取列表中的下一个链接,并继续执行此操作,直到列表变为空。
我只想显示每个链接的点击率。
发布于 2015-11-18 18:40:08
我可以建议的一件事是将你的链接封装到一个类中,让它有一个名为counter的变量来记录它。因此,基本上您将拥有Link类的列表。示例如下:
public class Link{
private String url;
private int count = 0;
public Link(String url){
this.url = url; // initialise your link class with a url
}
public String getUrl(){
increment();
return url;
}
public void increment(){
count++;
}
public int getCount(){
return count;
}
}然后像这样计算:
List<Link> links.... // initialise your links
Document doc = Jsoup.connect(links.get(i).getUrl()).get();这样,每次访问您的url时,计数都会递增,以记录总点击率。
https://stackoverflow.com/questions/33777049
复制相似问题