腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
apify
抓取
器
中
获取
标签
:
Web
、
Cheerio
和
Puppeteer
、
、
当我试图根据
Apify
网站上的示例
获取
起始URL的
标签
时,我得到了一个错误2019-12-26T15:35:17.723Z INFO: request.userData.label: undefined
Cheerio
scraper example code async function pageFunction(context) { const { request, log, skipLinks
浏览 24
提问于2019-12-27
得票数 0
2
回答
用vue js进行
Web
抓取
、
、
我期待着用Vue js制作一个网络
抓取
应用程序。 对于上面提到的套餐
浏览 2
提问于2020-07-06
得票数 1
1
回答
从
多个sitemap.xml文件
中
抓取
urls
我正在为一个页面构建一个
apify
参与者,其中所有所需的urls都存储在不同的sitemap.xml文件
中
。文件名是静态的,但不知道
如何
向参与者添加多个sitemap.xml文件。不知怎么的,需要在多个url上做一个for -每个url,但是由于有大约600个url,最好是
从
csv中提取所有的站点地图,然后逐个
抓取
url,然后
抓取
每个url。const
Apify
= require('
apify
'); const
chee
浏览 0
提问于2019-08-27
得票数 1
回答已采纳
3
回答
Node Js &
Puppeteer
-
如何
选择Anchor标记内的文本
、
、
、
、
关于
如何
抓取
这样的文本,我已经没有想法了。
浏览 24
提问于2020-04-10
得票数 3
回答已采纳
2
回答
抓取
网站以检索html元素
和
相关样式
、
、
、
、
我试图
抓取
网站上所有带有
标签
的元素,例如$('header')和它们的相关样式。本质上是遍历每个元素,
获取
与其相关的css,并将其全部转储到一个文件
中
。目前,我已经设置了以下内容:const
puppeteer</
浏览 23
提问于2019-11-11
得票数 0
1
回答
如何
使用
Puppeteer
库返回一个值来
抓取
动态网页?
、
、
、
、
我正在使用
cheerio
.js
和
puppeteer
.js跟随这个来尝试做一些基本的
web
抓取
。当我试图在服务
器
端编写它时,我并没有完全遵循教程的做法,我的想法是让我的后端处理所有的
抓取
,然后在将来将数据传递到前端。node server.js Your app is listening on port 8080 [Function]const <
浏览 1
提问于2019-03-30
得票数 0
回答已采纳
1
回答
如何
检索文本区域的值
、
、
、
、
我试图使用
cheerio
访问文本区域中的文本,但是它的文本没有显示在HTML Dom
中
。x-form-textarea" autocomplete="off" aria-invalid="false" data-errorqtip="" style="width: 100%;"></textarea> 这是浏览
器
中文本区域的图片我猜它是某种服务
器
生成的文本,没有显示在Dom
中
(是吗?)。
浏览 12
提问于2020-01-14
得票数 0
2
回答
Cheerio
选择的现有属性有时会返回undefined (get HTML with
Puppeteer
)
、
、
、
我使用
Puppeteer
获取
网站HTML,然后用
Cheerio
抓取
数据。以下是我的代码的一部分。它几乎每次都工作得很好,但有时我在companyAddress
和
companyIntro
中
得不到定义。会不会是
抓取
过程
中
Puppeteer
的问题?
Cheerio
代码是同步的,所以我不认为
Cheerio
是问题所在。我从来没有得到过错误:无法
获取
未定义的attr('profile&
浏览 42
提问于2021-02-24
得票数 3
1
回答
从
apify
到google :
如何
将特定的列导入到工作表
中
?
、
、
在新的代码世界
中
,我发现
Apify
是一个很好的解决方案,可以
抓取
URL并从网页
中
很容易地提取特定的元素。
Apify
提供的
Web
刮刀非常漂亮
和
强大。现在,我想更进一步,使用外部源
获取
网址(Google,Airtable.)并使刮伤部分自动化。我的问题很简单:
如何
从
外部数据库自动检索URL并将其直接粘贴到Start URL字段
中
,如下所示: 非常感谢!
浏览 14
提问于2022-10-06
得票数 0
3
回答
如何
在所有脚本
和
页面加载完成后
获取
所有html数据?(木偶戏演员)
、
、
、
、
最后,我想到了
如何
使用Node.js。已安装所有库/扩展。所以
puppeteer
可以工作了,但是
和
之前的Xmlhttp一样...它只
获取
页面的模板/主体,而不
获取
所需的信息。在浏览
器
(
Web
app?)
中
打开页面几秒钟后,页面上的所有脚本都会启动。我需要在整个页面加载后获得某些标记内的信息。const
puppeteer
= require('
puppeteer
'); cons
浏览 0
提问于2019-02-07
得票数 13
1
回答
使用
Cheerio
从
抓取
页面
获取
信息
、
、
、
我正在用
Puppeteer
和
Cheerio
实现
web
scraping Node服务
器
。因此,我正在进行UI输入,以便通过刮取
器
发送对SoundCloud搜索的请求,并从那里
获取
结果。因为我所关心的是URL
和
歌曲名称,这是
从
抓取
<a>得到的 它在子跨度标记中保存名称(在他的"class“attr
中
),URL作为href就足够了。
浏览 13
提问于2019-11-07
得票数 0
1
回答
从
Twitch
中
抓取
数据
、
、
、
、
我已经尝试使用phantomjs打开站点,但到目前为止我还不能想出
如何
让该部分渲染。(首选R
中
的解决方案,但不是强制性的)
浏览 90
提问于2019-04-24
得票数 0
2
回答
缩短axios text/html响应
、
、
、
、
我正在向一个网页发送一个Axios请求,要求
从
其中
抓取
一个小字符串,但返回的响应是一个很大的html,而我只需要它的一小部分,有没有办法缩短响应,这样我就可以保存数据并使请求更快?
浏览 20
提问于2021-01-27
得票数 0
回答已采纳
1
回答
有没有可能用Node.js
从
多个网站
抓取
数据?
、
、
我有一个用JavaScript创建的移动应用条形码扫描
器
,并想使用网络刮刀
中
的UPC码来获得产品的信息。const
cheerio
= require('
cheerio
'); uri: `https://
浏览 7
提问于2018-02-14
得票数 0
1
回答
使用node.js
从
div
中
检索文本
、
、
目前,我正在尝试编写一个刮刀
器
,它将使用node.js
从
facebook帖子
中
的div
中
获取
所有'p‘标记。页面上的每一篇文章都在div
中
,它们都有以下类:.text_exposed_rootrequest(BTTS, f
浏览 5
提问于2015-11-09
得票数 1
回答已采纳
1
回答
如何
在木偶机Node.js
中
获取
href属性
、
、
、
我希望使用
puppeteer
和
NodeJS
从
表中提取信息。但我需要帮助从一个表格单元
中
获取
链接。该表没有类名或ID。'AFC', },const pupperteer = require("
puppeteer
浏览 4
提问于2022-11-17
得票数 1
回答已采纳
1
回答
React本机登录到网页
、
有没有人可以给我指出正确的方向,告诉我
如何
为react native编写一段代码,
从
用户那里
获取
输入(用户名
和
密码),然后用in登录到网站。还有任何人都可以推荐的react原生
web
抓取
库(我正在考虑使用
Cheerio
) 提前感谢:)
浏览 13
提问于2019-02-23
得票数 0
1
回答
无法在for循环中传递项目以同时打印两个项目
、
、
、
我用node编写了一个脚本,
从
网页的登录页面
抓取
不同帖子标题的titles
和
urls,然后
从
其内部页面
获取
每个用户的profile name。我唯一不能解决的问题是在for loop
中
打印items
和
output这两个东西。var request = require('request')
浏览 32
提问于2019-04-10
得票数 2
1
回答
访问div下的第一个<ul>元素
、
我是一个网络
抓取
的新手,我正在尝试使用教程创建一个简单的网络
抓取
器
。我这样做了,然而,我想尝试实现我自己的另一个功能。在链接()
中
,我试图
从
“指南”(页面右侧)
中
获取
所有要点。现在,我可以
从
“指南”、“信息”
和
“relatedReddits”
中
获取
所有信息。然而,我只是试图
从
“指南”
中
获得信息。谁知道
如何
修改我的代码,只访问div下的第一个ul标
浏览 3
提问于2020-07-30
得票数 0
1
回答
如何
对机器人进行调查?
、
、
、
我在市场研究公司工作,在我们的数据
中
,我们经常需要检查的一件事是完成调查的机器人的存在,而不是一个真正的人类。 我们在这方面使用了几个度量标准,而且我们相当肯定我们抓住了其中的大部分。所以,我想我可能会尝试利用我的职业
中
的一个问题,并使它得到一些好的利用。它所需要做的就是在页面上随机选择一个元素,然后点击next按钮(它有一个标准的div
和
javascript函数)。
浏览 2
提问于2020-02-03
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券