腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
办法
使用
机器人
加载
/
访问
完整
的
网页
(
所有
子
页面
)?
、
、
目前我有一个
网页
,它与清漆缓存工作。但是,要使此缓存工作,必须先
访问
页面
,然后才能开始从缓存
加载
。我
的
问题是,我在这个网站上有数千个
页面
,我不能一个接一个地
访问
它们,因为这会花费很多时间。
有没有
网络爬虫或类似的东西来做这个任务?只是为了
访问
页面
,因为
访问
页面
会生成缓存文件,然后它
的
工作速度会更快。
浏览 14
提问于2017-03-03
得票数 0
2
回答
记录
页面
浏览量
的
正确方法
使用
PHP记录
网页
浏览量
的
正确方式是什么?我相信目前我们只是在每次
页面
被点击时记录一个视图,但我假设这包括来自
机器人
的
点击,或者其他我们不想记录
的
东西。我们如何才能只将真正合法
的
视图记录到数据库中,而不包括不应计入实际
页面
视图
的
内容呢? 谢谢!
浏览 0
提问于2015-04-20
得票数 1
1
回答
从通过javascript填充
的
网页
中获取内容
、
、
、
我正在尝试
使用
Html Agility Pack来解析一个
网页
,从我
的
尝试中我了解到这个
网页
是
使用
javascript“填充”
的
。当我
使用
以下命令
加载
页面
时我得到一个空页。可以说,这个
页面
是一个
子
页面
,我
使用
原始
页面
删除这些
子
页面</em
浏览 1
提问于2014-08-10
得票数 0
1
回答
C# Webclient.DownloadString() -如何在下载前等待
页面
加载
?
、
我正在
使用
Webclient.DownloadString()下载一些
网页
的
完整
超文本标记语言。问题是一些
页面
使用
Ajax
加载
图像等,因此从
页面
看起来完成
加载
到实际
加载
所有
内容(包括Ajax图像)需要3-4秒。那么
有没有
办法
让Webclient.DownloadString()在检索超文本标记语言之前等待X秒呢? 谢谢,路易莎
浏览 1
提问于2014-05-09
得票数 0
1
回答
防止直接
加载
Ajax内容
、
我
的
网站
使用
AJAX
加载
一些标签。选项卡页
的
内容是PHP文件。
有没有
办法
阻止
机器人
直接提供这些TAB
页面
?我尝试在TAB
页面
中添加以下内容,但不确定这
浏览 3
提问于2017-02-15
得票数 0
4
回答
如何
使用
javascript完全卸载swf (声音和
所有
)?
、
、
、
所以,我有一个
网页
,它
使用
javascript让用户选择不同
的
音频文件来收听(
使用
这个播放器:),它在除了IE
的
任何版本之外
的
所有
浏览器中都工作得很好。在音频开始播放后,我想不出一种编程方法来使音频在用户单击要收听
的
另一个项目后停止播放。我无法
访问
swf
的
源代码,所以我尝试
使用
javascript来完成此操作。我甚至替换了
页面
的整个正文-$(“body”).html(“空白”)-但
浏览 2
提问于2010-09-30
得票数 0
回答已采纳
1
回答
当
使用
ember-cli运行"ember test --serve“时,你如何
访问
你
的
main ember应用程序?
、
通常,当我
使用
"ember serve“运行我
的
ember应用程序时,我可以
访问
localhost:4200并查看我
的
网页
。但是,当我想
使用
"ember test --serve“运行测试时,我只能
访问
localhost:7357上
的
测试
页面
。当我运行"ember test --serve“时,
有没有
办法
访问
我
完整
的
浏览 1
提问于2015-01-13
得票数 1
1
回答
如何查找
网页
的
所有
未链接
子
站点?
有没有
办法
,找到一个站点
的
所有
子
站点?甚至是那些没有被这个网站引用
的
。例如:我有网站www.foofoo.de,这个网站有三个
子
站点--www.foofoo.de/ have,www.foofoo.de/dog,www.foofoo.de/老鼠。Site www.foofoo.de有指向/horse和/dog
的
链接,但没有指向/mouse
的
链接。不过,我仍然可以<em
浏览 0
提问于2018-05-26
得票数 1
1
回答
Google搜索结果显示指向
子
页面
的链接,而不是
完整
的
url
当我在我
的
网站上进行google搜索时,google列出了我
的
网页
的
所有
搜索结果,并带有指向
子
页面
的链接,而不是
完整
的
url。(以绿色显示)。这样可以吗?
有没有
可能强制谷歌显示
完整
的
网址,而不是几个链接到
子
页面
。 谢谢
浏览 1
提问于2013-09-26
得票数 0
1
回答
有没有
办法
获取域名
的
站点地图?
、
、
、
、
作为作业
的
一部分,我试图获得一个
网页
上
的
所有
链接和
子
域。例如,"www.stanford.edu“返回"www.stanford.edu/admissions"、"www.stanford.edu/academics"、"cs.stanford.edu"等
的
散列我找到了
使用
Mechanize和Spidr gem
的
方法,如"“和"”所示。然而,<
浏览 1
提问于2015-06-21
得票数 1
1
回答
js强制
页面
进入iframe -谷歌会抓取它吗?
、
、
、
我有一个脚本,重新
加载
一个博客
页面
,如果它不在我
的
网站上
的
iframe。这会不会干扰搜索引擎抓取博客?我
的
直觉告诉我,这个脚本不会阻止博客被抓取,但它会干扰搜索引擎生成
的
任何跟随它们
的
链接,因为这些链接会将带有js
的
用户转储到博客
的
“顶层”,而不是他们想要
的
页面
。要解决这个问题,需要一些花哨
的
cookie工作。
浏览 0
提问于2010-08-05
得票数 0
1
回答
在Watir中如何在
访问
网页
前
加载
cookie
、
因此,我知道可以
使用
以下命令从文件中
加载
Watir中
的
cookie:问题是,这只会为我当前所在
的
页面
加载
cookie。因此,如果我想
加载
网页
的
cookie,我必须在这样做之前
访问
它。
有没有
办法
在
访问
页面
之前
加载
cookie?
浏览 19
提问于2017-03-05
得票数 2
回答已采纳
5
回答
防止
机器人
处理网站上
的
图像
我有一个用PHP技术创建
的
网站,我想阻止
机器人
从website.What中获取图像,这是防止
机器人
从网站上处理图像
的
最佳方法吗? 请确保它不会伤害SEO。请确保这不影响间谍和爬虫索引网站.
浏览 8
提问于2010-12-14
得票数 0
回答已采纳
1
回答
如何
使用
python selenium
访问
网页
检查元素内容?
、
、
、
我要做
的
就是抓取
网页
'‘。在这种情况下,当标签估计(在下面的可比较和估计部分)被选中时,google地图下面的数据被动态
加载
。此数据在
页面
源代码中不可见,但同时在开发人员工具窗口(上下文菜单,检查元素)中可见。 我
使用
的
是Selenium和Python 2.7。
有没有
办法
访问
这些数据?或者
有没有
办法
访问
所有
的元素?
浏览 0
提问于2014-05-09
得票数 0
1
回答
Reddit
机器人
-绕过或点击“是”超过18检查?
、
、
我正在制作一个Reddit评论
机器人
,它将爬行
子
Reddit,因为它找到了
页面
中
的
链接。我
的
问题是,当我试图用18+年龄问题抓取NSFW时,尽管在我正常
的
浏览器上点击了“是”,Reddit每次C#
机器人
访问
这些
页面
时都会返回一个18+年龄问题。
有没有
办法
避免这种情况,或者通过编程点击“是”按钮?
浏览 2
提问于2014-04-12
得票数 1
2
回答
防止整个网站下载?
、
有一个IP (来自中国)正试图下载我
的
整个网站。它会下载我
所有
的
页面
,并显著地
加载
服务器(我有超过50万个
页面
)。查看
访问
日志,我可以断定它肯定不是Google
机器人
或任何其他搜索引擎
机器人
。我暂时禁止了它(
使用
iptables规则),但这对我来说不是一个解决方案,因为我
的
一些真实用户也有相同
的
IP,所以他们也被禁止
访问
网站。
有没有
办法
防止这种
浏览 0
提问于2010-08-30
得票数 6
回答已采纳
1
回答
我们可以
访问
一个DOM元素而不将它
加载
到无限滚动
的
网页
中吗?
、
、
、
、
我知道我想在一个无限滚动
的
巨大
网页
上
访问
的
元素
的
类名。而且,我
的
目标是
访问
(获取链接地址)具有这个特定类名
的
所有
这样
的
元素。我可以自动滚动,然后
访问
元素,但当
页面
变大时,几乎不可能进一步滚动(我只能滚动
网页
的
1%!)。
有没有
办法
让我不用
加载
就能
访问
所有
这些元
浏览 3
提问于2014-12-21
得票数 0
1
回答
网站上
的
子
域和相关链接
、
、
、
、
我正在处理一个
网页
的
完整
结构,我
使用
目录到网站
的
网址,用户可以理解网站地图,类别和子类别。例如。我
的
主页是www.mantarrayamx.com。我试图
加载
的
页面
是www.mantarrayamx.com/services/ seo,但是对于seo,我
使用
子
域seo.mantarrayamx.com直接
访问
这个目录。我正在
使用
第三方代码,例如
浏览 1
提问于2015-11-30
得票数 0
回答已采纳
1
回答
dotnet核心C# Selenium从chrome开发人员工具网络选项卡中获取详细信息?
、
、
、
、
我正在
使用
dotnet核心C#和selenium
加载
页面
并运行一些测试。我想获取详细信息,显示在chrome开发工具
的
网络选项卡中。
加载
的
资源列表以及每个资源
的
大小和路径,并能够计算
网页
及其
所有
资源
的
总
加载
时间和传输大小。 我知道我可以用javascript获取资源列表。var list = performance.getEntriesByType('resource'); 但这
浏览 81
提问于2020-01-16
得票数 1
1
回答
机器人
可以“点击”
网页
上
的
JavaScript链接吗?
、
我们有一个发送调查电子邮件
的
平台-电子邮件中
的
链接将用户带到一个询问一系列问题
的
网页
。 要回答问题,用户单击他们选择
的
答案-这
使用
JavaScript onclick来注册答案。我们知道一些安全软件(如Barracuda)会通过电子邮件中
的
链接来确定端点是否存在风险,但是
有没有
办法
触发
页面
上
的
onclick操作呢? 如果是这样的话,
有没有
办法
区分
机器人</
浏览 29
提问于2019-04-04
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用 Python 获取 QQ 群投票数据
中国香港服务器延迟高的解决办法
优化网站加载速度的14个技巧
Python爬虫无法获取页面内容的常见原因及解决方法
python如何使用Selenium获取弹出框架中的内容
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券