腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
当我使用HTTrack或Save all Resources on a HTML web page时,为什么不能生成所有的元素?
、
、
、
我正在尝试了解这个名为Paper.io
的
在线游戏背后
的
一些
代码
和逻辑。 为此,我希望将整个网页及其资源保存在我
的
计算机上,并查看每个元素
的
不同反应。我已经尝试使用保存所有资源,chrome扩展和HTTrack,网页
抓取
工具,以获得此网页
的
所有资源。任何不同工具或策略
的
帮助或建议都将受到高度赞赏。
浏览 2
提问于2021-02-24
得票数 0
2
回答
是否需要为每个目标站点编写
抓取
器?
、
、
、
、
我是个刮东西
的
新手。我写了一个 刮板 它将擦伤 Maplin 商店。我使用Python语言和BeautifulSoup来
抓取
存储。我想问
的
是,如果我需要清理一些其他
的
eCommerce商店(比如亚马逊、Flipkart),我是否需要定制我
的
代码
,因为它们具有不同
的
HTML ( 和 名字是不同
的
,另外还有其他东西)。所以,我写
的
刮板不适用于其他eCommerce商店。 我想知道比价
网站
是如何从所有在线商店中
抓取
浏览 40
提问于2014-12-28
得票数 7
回答已采纳
1
回答
如何下载HTML元素,该元素在检查时显示,但在显示整个页面源
代码
后却不显示?
、
在sensortower.com上,有一种功能允许显示应用程序
的
等级。例如,以下是Snapchat
的
URL: <td data-bind="text: $data.rank">8</td> 但是,当我单击“查看页面源”时,这个特
浏览 1
提问于2019-09-27
得票数 0
回答已采纳
2
回答
从棘手
网站
抓取
/解析数据
的
css
选择器
代码
、
、
、
、
我有困难开发一个适当
的
"
CSS
选择器“
代码
来
抓取
/解析以下HTML
的
赔率。我对node.
js
比较陌生。但在过去,我成功地
抓取
了类似的
网站
。不幸
的
是,这个
网站
有点棘手(对我来说是这样!)。我可以断定问题出在我使用
的
CSS
选择器
代码
上。你能告诉我如何写一段
代码
,让我从..
浏览 3
提问于2016-03-06
得票数 0
1
回答
google和/或必应爬虫会惩罚隐藏
的
twitter引导选项卡中
的
内容吗?
、
、
、
、
我
的
网页将由谷歌和必应爬虫爬行。</p> </div>由于非活动选项卡上
的
内容是隐藏
的
,我可以看到搜索引擎在爬行
网站
时使用了很大
的
惩罚或者完全贴现了这些内容--这对标签来说不是好消息,因为它们需要被删除马特卡茨说,是如此
的
清楚,你可能会因为隐藏文本而受到惩罚。但是,引擎可能足够聪明,能够区分有效隐藏和无效隐藏。 我对隐藏标签
的
关注是正当<em
浏览 1
提问于2013-10-03
得票数 5
回答已采纳
1
回答
编辑样式和Typekit
、
我
的
网站
使用typekit
抓取
自定义字体,这在前端工作。 我想把这个放在我
的
编辑风格
的
后端。但是,我不知道我会怎么做。Typekit使用
js
嵌入
代码
段,而不是
css
字体面板嵌入
代码
段。
浏览 0
提问于2012-07-25
得票数 10
回答已采纳
1
回答
httrack仅下载index.html文件
、
、
、
通常,当我使用Httrack下载
网站
时,我会得到所有的文件;图片,
CSS
,
JS
等。今天,程序在2秒内完成下载,只
抓取
了index.html文件,里面还有
CSS
,IMG
代码
等仍然链接到外部。我已经将我
的
设置重置为默认设置,但没有帮助。有谁知道如何将其改回正常运行?
浏览 5
提问于2014-11-23
得票数 0
1
回答
使用JavaScript获取站点
的
HTML、
CSS
和JavaScript
我见过很多关于用Jquery + node.
js
+ YQL
抓取
html
的
问题。它没有提到从网页中获取
css
和javascript。有没有办法在不使用服务器端技术
的
情况下获得外部
网站
的
html、
css
和javascript? *我需要这在
代码
中发生,这样我就可以在webapp应用程序中使用结果。
浏览 1
提问于2013-02-12
得票数 1
1
回答
使用scrapy
抓取
动态网页中
的
数据
、
、
我正在尝试从中
抓取
一些数据。它成功地
抓取
了活动摘要、活动详细信息和为什么它
的
绿色部分,但是,当我爬行LEED仪表板部分时,响应是空
的
。具体地说,我希望得到6个分数,EA、MR、IEQ、SS、WE和ID,但是当我使用这个xpath时,这些值都是空
的
。
浏览 3
提问于2021-05-06
得票数 0
1
回答
显示来自外部
网站
的
特定数据
、
、
、
假设这是外部
网站
:headercontent1footermy titlemy headermy contentmy footer我希望这是足够清楚
的
浏览 2
提问于2013-09-04
得票数 1
1
回答
显示链接
的
内容
、
、
我一直在互联网上搜索,以获得一些关于我如何能够检测和显示url
的
信息。Facebook有一个很好
的
例子说明了我真正想要实现
的
目标:如果你在facebook上创建了一个更新,并粘贴了一个URL,facebook将检测到有关它
的
一些信息,并显示一个框,其中包含一些文本,通常还有正确
的
图片然后它会显示鞋子
的
图像和标题。 我已经找到了其他服务,做这一点与图像服务和youtube,但我需要
的
是关于获取产品信息
的
大部分时间,所以经常从商店
的
网址。
浏览 1
提问于2014-12-09
得票数 0
2
回答
如何使用javascript对多页应用程序进行屏幕
抓取
?
、
如何对多页应用程序进行屏幕
抓取
?我想用Javascript来做这件事。以下是我考虑过
的
方法和遇到
的
问题。问题:网页在获取时不能正确加载。我猜当页面被获取时,页面上
的
所有javascript都不会运行。这是将JavaScript直接注入到文档中
的
一种非常简单
的
方法。有什么更好
的
方法可以解决我遇到
的
问题?
浏览 53
提问于2018-10-09
得票数 0
回答已采纳
1
回答
为什么scrapy在这个例子中不能工作?
、
我试图从一个
网站
抓取
数据,如文章枚举,定价和股票,并将其导出到excel工作表。 以下脚本成功登录。未登录时,仅可见articl枚举器。我测试了刮刀,它成功地
抓取
了文章编号。在下面的示例中,我尝试将登录和
抓取
数据结合起来,但它不起作用。 我做错了什么?for i in response.
css
('div.productlistblock.row'): artkl = i.
css
('div.articlenumber::text
浏览 15
提问于2021-11-05
得票数 0
2
回答
链接到下一页
的
CSS
选择器在Scrapy shell中返回空列表
、
、
、
我是新来Scrapy
的
。我尝试从此站点https://book24.ru/knigi-bestsellery/?section_id=1592获取到下一页
的
链接 html是什么样子
的
:enter image description here 在scrapy shell中,我写了这个命令: response.
css
我也试过 response.
css
('a.pagination__item._link._button._next.smartLink'
浏览 46
提问于2021-10-15
得票数 2
回答已采纳
1
回答
使用Javascript和/或jQuery获取包含
的
css
文件
的
内容
、
、
我正在制作一个文档
网站
,在那里我展示了html,
css
和
js
示例。目前,我获取导航栏
的
html并将其放入
代码
块中:我希望能够用
css
做一些类似的事情所有导航栏
css
都是这样包含
的
: <link href="
css
/navbar.
c
浏览 3
提问于2014-07-24
得票数 1
1
回答
我怎样才能让我
的
刮板
网站
-设计-更改容错?
、
、
我已经用ruby写了一个网页
抓取
器。但是我正在
抓取
的
网站
已经改变了它们
的
design.Thus,我
的
刮板正在失效。有没有一种聪明而简单
的
解决方案来解决这种固有的刮刀问题?(".poster_information") puts doc.
css
(".comment_block")在上面的示例
代码
片段中,我在
浏览 1
提问于2012-07-14
得票数 3
回答已采纳
7
回答
如何从
网站
上
抓取
所有内容?
、
、
、
我开发
网站
,有时客户已经有
网站
,但需要他们完全翻新,但大多数内容和图像需要保持不变。我正在寻找软件,即使它很昂贵,或者是一个桌面应用程序,它可以让我轻松地输入URL并将所有内容
抓取
到我本地计算机上
的
指定文件夹中。任何帮助都将不胜感激。
浏览 2
提问于2011-04-25
得票数 2
回答已采纳
1
回答
如何在Siteground托管服务器中运行Python脚本
、
我正在建立我
的
网站
,其中包含一个python(.py)文件,超文本标记语言,
css
和
JS
文件。我想知道,我怎样才能运行我
的
python脚本在我
的
网站
从我
的
托管帐户,以便它可以从一个
网站
抓取
数据,并输出一个JSON文件到Javascript文件,可以显示在网页上。
浏览 15
提问于2021-01-06
得票数 0
1
回答
视差脚本(在Enjin中注入
代码
)不能单击按钮
、
、
、
、
所以,经过无数次尝试之后,我终于在上启动并运行了我
的
视差
网站
背景,现在唯一
的
问题是(你可以自己看到),每当你进入该
网站
时,你都不能点击任何按钮,一旦你点击并
抓取
任何地方,你就会看到你正在
抓取
视差效果中
的
一幅图像所以我假设视差在
网站
层之上,我不能直接编辑,这就是为什么我注入
代码
的
原因。 现在我尝试在
CSS
中设置z-index:-1和-9999,但遗憾
的
是没有改变任何东西。因此,我认为
浏览 2
提问于2014-09-17
得票数 0
回答已采纳
1
回答
下面的JavaScript
代码
与Facebook相关
document.createElement('script');我不确定这个al.
js
是做什么
的
。附加到fb-root元素
的
结果。 这个异步函数是做什么
的
?为什么它被称为“刮板”?
浏览 0
提问于2012-09-08
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
web前端学习中CSS,JS代码压缩
Python项目实战:抓取大型网站JS特效模板
做网站-推荐3种CSS,JS合并的方式
利用JS和CSS防止网站内容复制和检测开发者工具代码
css、js加密或不封装会影响网站排名?
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券