腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Apify
Puppeteer
爬
行时
的
内存
问题
、
、
、
、
我一直在做一个Python项目,在这个项目中,用户向程序提供一个很长
的
URL列表(比如说100个URL),程序将产生100个进程来执行包含爬虫代码
的
JavaScript代码(
使用
Apify
.launchPuppeteer此外,还根据
Apify
Puppeteer
单页面模板创建和修改了JavaScript代码。 但是,同时调用100个进程
的
爬行代码会占用大量
内存
,这会导致延迟。由于Python代码等待从JavaScript代码写入
的
文件
浏览 60
提问于2020-04-18
得票数 0
回答已采纳
1
回答
使用
Apify
抓取多个页面
、
可以
使用
带有伪URL
的
Apify
抓取多个页面吗? 当人们问同样
的
问题
时,答案大多指向伪URL,如果有可能或不可能这样做,并不会直接解决
问题
。如果我在运行爬虫
的
时候不知道伪URL,并且我从一个页面上抓取了10个链接-然后想要抓取这10个链接,那怎么做呢?https://kb.
apify
.com/tutorial-creating-your-first-crawler/crawling-multiple-pages
浏览 15
提问于2019-03-19
得票数 0
1
回答
如何在Google云功能上
使用
Apify
、
、
我正在部署一些
使用
Apify
作为Google函数
的
代码。当触发时,云函数将无声地终止。我做错了什么?下面我用更简单
的
代码重现了这个
问题
。虽然本例并不严格要求
Apify
,但我希望能够
使用
浏览 0
提问于2019-07-10
得票数 0
回答已采纳
1
回答
Try/catch处理程序
的
行为不一致
、
、
、
、
我在一个
Puppeteer
脚本中有以下错误处理程序。在我
的
电脑上从node运
行时
,它运行得很好。但是,当从
Apify
Puppeteer
Scraper运
行时
,它只有在我取消注释console.log(e)时才起作用。{ console.log('Foobar not found.');} 在其他语言中,我会怀疑糟糕
的
内存</
浏览 9
提问于2019-07-29
得票数 0
回答已采纳
1
回答
找不到木偶剧相关模块和依赖项
、
、
、
、
我
使用
npm安装了
puppeteer
,然后在尝试编译它时,出现了以下错误:* ./types/standard in ./node_modules/
puppeteer
/node_modules/mime/index.js
浏览 1
提问于2019-04-04
得票数 1
1
回答
配置
puppeteer
的
chromium浏览器
的
语言还是
使用
Apify
代理?
、
、
、
、
在args中配置
puppeteer
Crawler启动选项是否更好,就像在puppeter中那样: const pptr = require("
puppeteer
"); headless: false, '--lang=fr' })(); 在
Apify
中,据我所知将是这样
的
: const
Apify
浏览 45
提问于2020-09-25
得票数 0
1
回答
为什么
Puppeteer
solveRecaptchas()
的
“不是一个函数”?
、
、
我试图通过
使用
Puppeteer
和来解决登录页面上
的
Recaptcha
问题
。TypeError: page.solveRecaptchas is not
浏览 0
提问于2021-10-17
得票数 1
回答已采纳
2
回答
为什么"context.
Apify
“没有定义
、
、
我正在学习如何在
Apify
Web-Scraper中
使用
request,我不明白它是如何工作
的
。 我首先用Postman做了这件事,我确实得到了我想要
的
结果,现在我想在
Apify
上做同样
的
事情。const request = new context.
Apify
.Request({ method: 'POST',
浏览 20
提问于2019-09-02
得票数 0
回答已采纳
1
回答
如果设置了
APIFY
_DEFAULT_DATASET_ID,则找不到默认数据集
Apify
documentation 解释说,默认数据集可以通过设置环境变量
APIFY
_DEFAULT_DATASET_ID来命名。如果我这样做,在创建
puppeteer
crawler之前
使用
代码示例1(见下文),如果我爬行页面并
使用
代码示例2存储结果,我会得到一个。//代码示例1:设置默认数据集id process.env.
APIFY
_DEFAULT_DATASET_ID = da
浏览 23
提问于2019-10-20
得票数 0
1
回答
将cookie从Actor传递给Crawler
我用我想要抓取
的
URL设置了一个爬虫,演员正在工作,我用cookie/截图示例进行了测试。我只是在演员和爬虫之间传递cookie时遇到了
问题
: const
Apify
= require('
apify
'); const input= await
Apify
.getValue('INPUT'); const browser = await
Apify</em
浏览 26
提问于2019-05-10
得票数 0
1
回答
为什么我不能
使用
Apify
/
Puppeteer
在iFrames中导航?
、
、
我正在尝试
使用
Puppeteer
在其中
使用
iFrames来操纵站点
的
表单。我尝试了不同
的
方法来联系一个特定
的
iFrame,甚至在一个网站上计算iFrames,但都没有成功。为什么
Puppeteer
的
对象不能识别我试图浏览
的
页面的iFrames /子帧?其他页面也是如此,比如https://www.veiculos.itau.com.br/simulacao const
Apify</em
浏览 15
提问于2020-12-02
得票数 0
1
回答
Apify
.utils.
puppeteer
对象中缺少方法
如果我“需要”
Apify
并
使用
Chrome调试器检查
Apify
.utils.
puppeteer
的
方法,那么就会遗漏一些文档中记录
的
方法。
浏览 12
提问于2019-10-08
得票数 0
2
回答
使用
Apify
/
Puppeteer
,抓取所有URL,但包含一个单词
的
URL除外
、
有了
Apify
/
Puppeteer
,除了包含某个单词
的
页面外,我还能爬行所有页面吗?在handlePageFunction内部,原始代码如下所示 requestQueue,如果我想避免包含"foo“
的
页面URL,那么我是否可以在pseudoUrls中调整一些内容来修复这个
问题
呢?
浏览 14
提问于2022-07-08
得票数 1
回答已采纳
1
回答
如何用
Apify
实现iframe表单数据序列化
、
好
的
,我试着序列化一个表单数据,但是我在下面的代码中没有定义: const frame = page.frames().find(frame => frame.url().includes('reservation
浏览 16
提问于2019-09-23
得票数 1
回答已采纳
1
回答
向p-queue添加函数以处理并发停止队列
、
我正在
使用
和
Puppeteer
。我们
的
目标是运行X个Chrome实例,其中p-queue限制了并发数量。当队列中
的
任务发生异常时,我希望重新排队。但是当我这样做
的
时候,队列就会停止。我有以下几点: const browser = await
puppeteer
.launch({headless: false});
浏览 0
提问于2019-10-14
得票数 0
3
回答
如何
使用
apify
sdk让
puppeteer
无头运行?
、
、
、
、
我正在尝试
使用
apify
sdk抓取页面内容。这也可以与以下代码很好地配合
使用
。但是我怎么才能像
puppeteer
.launch一样强制
使用
Apify
SDK
的
无头模式({ headless : true})?供您参考
的
代码: async function scrape(number) { constURL = "https:
浏览 49
提问于2020-10-12
得票数 1
1
回答
在
使用
时,未能在“innerHTML”属性上设置“元素”
、
我试图
使用
app在Play Store上抓取应用程序
的
页面,并检索一些信息来构建一个定制
的
RSS提要,类似于显示
的
。_evaluateInternal (/home/myuser/node_modules/
puppeteer
/lib/cjs/
puppeteer
/common/ExecutionContext.js:175-08-27T07:13:48.103Z at async wrap
浏览 8
提问于2022-08-28
得票数 0
2
回答
如何
使用
Apify
登录到网站并单击按钮?
、
、
我需要
使用
和来自动登录到一个受密码保护
的
网页,并点击一个按钮。我该怎么做?目标URL将不时更改。Zapier 据我所知,这不是一个刮擦
的
工作,因为我不希望从网页返回数据,所以我不应该
使用
或。
浏览 1
提问于2019-10-03
得票数 3
1
回答
在本地运行
Apify
时如何设置cookie?
经过大量
的
Googling搜索,我不知道如何
使用
原始cookies (即name1=value1; name2=value2; ...)为傀儡
Apify
爬虫设置cookies。我看到有Page.SetCookie,但这需要一个
Puppeteer
.Cookie对象数组。每次都很难格式化。 我还看到
Apify
支持在
Apify
仪表板上设置cookie。但是如果我想在本地运行我
的
应用程序,这是没有帮助
的
(至少我不认为,也许我错了)。 如果有什么方法可以做到这一
浏览 16
提问于2020-08-27
得票数 0
1
回答
应用码头如何运行
、
、
、
使用
Node/
Apify
/
Puppeteer
,我如何将我
的
应用程序封装起来并在本地测试运行?这是我
的
装置。/Documents/personal/testapp/my-first-act/
apify
_storage" at Mod
浏览 1
提问于2022-07-18
得票数 1
回答已采纳
点击加载更多
相关
资讯
前端开发爬虫首选puppeteer
爬虫使用 Selenium与Puppeteer 能被网站探测的几十个特征
推荐一款开源的网络爬虫和浏览器自动化库:Crawlee!
如何利用 Puppeteer 爬取数据?
Selenium 能被网站探测的几十个特征
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券