使用puppeteer抓取页面我能够从具有相同类的div列表中获取内容,并在这些div列表中嵌套div列表。
<div class="parent">
<div class="child"></div>
</div>
<div class="parent">
<div class="child"></div>
<div class="child"></div>
</div>
<div class="parent">
<div class="child"></div>
...
</div>
...
现在我的问题是,我需要重复列表并在子类div上运行page.click()以打开lightbox,在lightbox中选择要单击的元素,然后对其运行page.pdf()。
我目前在父类div上有一个for循环,在子类div上有一个内部for循环。我不确定如何使用for循环索引值选择正确的div,因为没有第n个类,等等。
我只是想运行像这样的东西
for (let a = 0; a < data.length; a++) {
for (let b = 0; b < data[a].length; b++) {
await page.click('.parent[a] .child[b]');
// other code here...
}
}
打开lightbox,然后使用
await page.waitForSelector('.ReactModal')
抓取lightbox html并运行
await page.pdf({
path: dir + "/"+ filename,
format: 'A4'
});
任何关于可能的方法的指导意见都将不胜感激。
发布于 2020-10-13 19:48:10
如果我理解正确的话,您可以尝试这样做:
for (const parent of await page.$$('.parent')) {
for (const child of await parent.$$('.child')) {
await child.click();
await page.waitForSelector('.ReactModal'); // maybe check if this is not the same lightbox
await page.pdf(/*...*/);
}
}
https://stackoverflow.com/questions/64335960
复制相似问题