文章/答案/技术大牛

发布

社区首页 >问答首页 >使用web crawler获取任何url /资源的命中计数

问使用web crawler获取任何url /资源的命中计数
EN

Stack Overflow用户

提问于 2015-11-18 18:06:20

回答 1查看 879关注 0票数 0

我用java做了一个网络爬虫。它递归地遍历每个页面中的链接。现在我想要得到一个特定页面的点击数。可以通过网络爬虫吗？因为我们不能访问服务器代码，所以我们不能添加任何计数器来计算命中率。请提出任何解决方案。谢谢。

代码的基本结构是：

->获取url的html源代码。->从html代码中找到可访问的链接，并将其放入列表中。->获取列表中的下一个链接，并继续执行此操作，直到列表变为空。

我只想显示每个链接的点击率。

java

web-crawler

jsoup

回答 1

Stack Overflow用户

发布于 2015-11-18 18:40:08

我可以建议的一件事是将你的链接封装到一个类中，让它有一个名为counter的变量来记录它。因此，基本上您将拥有Link类的列表。示例如下：

public class Link{
    private String url;
    private int count = 0;

    public Link(String url){
        this.url = url; // initialise your link class with a url
    }

    public String getUrl(){
        increment();
        return url;
    }

    public void increment(){
        count++;
    }

    public int getCount(){
        return count;
    }
}

然后像这样计算：

List<Link> links.... // initialise your links

Document doc = Jsoup.connect(links.get(i).getUrl()).get();

这样，每次访问您的url时，计数都会递增，以记录总点击率。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/33777049

复制

相似问题

问使用web crawler获取任何url /资源的命中计数
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用web crawler获取任何url /资源的命中计数EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用web crawler获取任何url /资源的命中计数
EN