腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何获取导入URL的数量
、
、
、
我正在通过Owasp Zap对不同的微服务进行DAST分析。有一次,在爬虫跑之前,他们给了我这个:
浏览 9
提问于2022-07-20
得票数 0
1
回答
bash脚本:网站中出现的单词
、
、
、
我需要一个脚本来
统计
网页上出现的单词。 我正在做的是计算随机it(避免多次检查相同的IPs ),使用nmap查看端口80是否打开,以了解它是否是web服务器,然后使用w3m将http页面作为文件。
浏览 0
提问于2012-08-03
得票数 0
2
回答
在scrapinghub中运行时对日志计数的抓取访问
、
、
这些
统计
数据可由
蜘蛛
stats对象(crawler.stats.get_stats())访问,例如: [..]如果我在剪贴上运行
蜘蛛
,日志
统计
数据就不存在了。还有很多其他的稀释法(例如异常计数,等等)但日志计数不见了。有人知道如何将它们送到那里吗?或者如何在刮取中心上访问它们?在
蜘蛛
关闭后,我还检查了“倾倒刮伤
统计
数据”的值。如果我在我的机器上运行它,日志计数就在那里,如果我在scrapinghub上运行它,日志计数就
浏览 7
提问于2014-12-02
得票数 0
回答已采纳
1
回答
python集扩展中的stats值
、
我试图写一个简单的刮擦扩展类发送爬虫
统计
,当
蜘蛛
关闭通过电子邮件。到目前为止,这就是我所拥有的,效果很好。但是现在我想弄清楚如何用刮过的域将列表添加到
统计
数据中。我查看了这些文档,但不知道代码应该是什么样子,应该放在哪里、在扩展中还是在
蜘蛛
类中。如何访问扩展类中被刮过的域,或者如何访问
蜘蛛
类中的
统计
数据?雅克
浏览 1
提问于2013-09-04
得票数 0
回答已采纳
1
回答
有没有可能在Scrapy中从管道中获取特定
蜘蛛
的
统计
数据?
、
、
我正在使用Scrapy与几个
蜘蛛
,并需要自定义的json输出,其中将包括一些
蜘蛛
统计
(成功的请求列表,错误列表等)。我已经制作了自定义项目管道,但我不知道如何从那里访问
统计
数据。
浏览 1
提问于2015-04-28
得票数 1
1
回答
需要建议:使用Perl的网络
蜘蛛
、
、
、
蜘蛛
应该:
蜘蛛
的目的是保持一个新的网站忙碌,模拟许多用户正在浏览它。 我看了LWP和WWW::机械化。
浏览 4
提问于2011-06-08
得票数 1
回答已采纳
2
回答
如何找出
蜘蛛
刮过的页数
、
、
、
我成功地从网站上抓取数据,但我想知道我的
蜘蛛
刮了多少页。
浏览 2
提问于2017-05-23
得票数 0
回答已采纳
3
回答
PHP
页面计数器脚本
、
显然,我是
php
的新手..我已经为一个网页创建了一个简单的页面计数器来监控浏览量。我已经设置了一个包含三列(id、page、views)的mySQL数据库。
php
$sql="SELECT * FROM view_log WHERE page
浏览 1
提问于2012-12-11
得票数 0
4
回答
如何以编程方式设置和启动Scrapy
蜘蛛
(urls和设置)
、
、
我用刮痕写了一个工作的爬虫, 在
蜘蛛
完成后再检索一些数据。起初,我认为是为此而设计的,但在阅读了文档之后,它似乎更像是一个守护进程,能够管理“打包
蜘蛛
”,也就是“刮擦蛋”;所有设置(start_urls、allowed_domains、settin
浏览 3
提问于2012-10-21
得票数 25
4
回答
如何监测抓取
蜘蛛
的健康状况
、
、
、
、
对于上下文,我不能使所有其他字段都是必需的,因为它们本质上是可选的(如colour、size等) 可能计算每个爬行填充字段的平均频率。
浏览 0
提问于2019-08-12
得票数 0
1
回答
检查是否从另一个站点的
PHP
脚本调用了
PHP
文件
、
、
、
、
最近,当我通过AWStats查看我的网络
统计
数据时,我发现了一些令我担忧的事情。第一个是“未知机器人”,列在“机器人/
蜘蛛
访客”标签下。第二行,也是最受关注的一行是同一个AWStats robots选项卡下的“A
PHP
script”。我在我的网站上运行不应该被其他网站的
PHP
脚本获取的内容。有没有办法将此记录到Apache日志中?换句话说,我如何判断脚本是否正在被
PHP
脚本调用(通过日志或
PHP
函数)?最后,下面列出了一个图像,它显示了我正在描述的内容。
浏览 3
提问于2015-01-17
得票数 2
1
回答
为什么这么多apache插槽被标记为“繁忙”?
、
、
统计
数据Mysql:http://i.imgur.com/vg6fj.png 谷歌分析:http://i.imgur.com/yl8Ui.png
浏览 0
提问于2012-08-03
得票数 2
回答已采纳
4
回答
我怎么知道是谷歌
蜘蛛
还是其他
蜘蛛
访问了我的页面?
、
、
我怎么知道是谷歌
蜘蛛
还是其他
蜘蛛
访问了我的页面?header('Location: index.
php
');} ?
浏览 3
提问于2010-11-13
得票数 2
回答已采纳
1
回答
如何从Scrapy中获得已经刮过的URL (request_count)的数量?
、
、
、
运行代码时,会显示这样的
统计
数据。datetime.datetime(2016, 11, 18, 14, 41, 37, 807590)} 我的目标是访问response_count或request_count中的process_response或任何方法的
蜘蛛
我想关闭
蜘蛛
,一旦N个总网址被我的
蜘蛛
刮走。
浏览 3
提问于2016-11-18
得票数 1
1
回答
如何对刮伤的python脚本进行分析?
、
、
、
start_urls = ['http://www.example.com'] # Extract links matching 'category.
php
' (but not matching 'subsection.
php
') # and follow links from them (since no callback means followRule(LinkExtractor(allow=('cat
浏览 2
提问于2017-10-21
得票数 8
1
回答
从
PHP
/HTML或
PHP
服务器调用scrapy脚本
、
、
、
、
我有一个刮擦的脚本,它将运行多个
蜘蛛
。我想从
PHP
/HTML代码中爬行单个
蜘蛛
或运行多个
蜘蛛
脚本。这有可能吗?如果是这样的话,是怎么做的?
浏览 2
提问于2015-11-22
得票数 0
回答已采纳
1
回答
用于
php
或等效程序的htmlunit
、
我正在写一个
蜘蛛
脚本,我需要
蜘蛛
来获得由javascript生成的内容,我听说htmlunit将执行javascript.My脚本是
php
,我如何获得与htmlunit的工作?有没有与
php
等同的?
浏览 1
提问于2011-10-23
得票数 1
回答已采纳
1
回答
擦伤电子邮件
统计
或错误
、
我的项目中有多个
蜘蛛
,我同时运行它们。当每个爬虫在错误或COMPLETION上完成时,我希望收到一封带有STATS或ERROR的电子邮件。
浏览 2
提问于2012-09-05
得票数 0
回答已采纳
4
回答
如何确定具有不同参数值的URL是否“唯一”?
我正在用
PHP
编写一个
蜘蛛
应用程序,它从一个域编译一个唯一URL列表,处理每个惟一URL上的HTML数据,然后生成关于这些页面的
统计
数据。举个例子,下面是我的
蜘蛛
收集的两个URL,它们在技术上是唯一的(“replytocom”的不同参数值),但也直接指向同一个页面: 我的问题是:是否有一种方法可以判断具有不同参数值的两个链接是否引用同一个页面?
浏览 1
提问于2013-08-05
得票数 0
回答已采纳
2
回答
在Bash脚本中收集网页
统计
信息
、
、
我需要收集每隔几秒钟检索一次网页所需时间的
统计
数据。我可以做一个(
蜘蛛
不会下载网页,只需检查它们是否在那里)我面临的问题是,我需要跟踪
统计
数据。
浏览 0
提问于2011-05-25
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PHP实现记录网站访问量统计功能示例
PHP+Mysql+jQuery实现对当前在线用户数统计
SEO蜘蛛池——如何搭建蜘蛛池
Web 服务器端编程语言使用统计:PHP 几乎独占 80%
网站怎样吸引到baidu蜘蛛#蜘蛛池sEo
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券