有没有办法以编程方式启动/安排谷歌外卖下载(所有46+服务)数据
我想对此数据进行定期备份(本地或Google Drive)
在谷歌没有应用程序接口的情况下,Puppeteer能被用来自动化用户点击吗?
发布于 2019-11-20 07:05:45
是的,这绝对是可能的。我建议使用无头浏览器,如Selenium或Puppeteer。要做到这一点,有几个步骤:
1)自动登录Google (如果需要)
2)自动导航到Google外卖并下载数据
3.解析数据
4)编写一个脚本,这样您就可以定期自动执行整个过程。
在编写web scraper时,还有几件事需要注意:
在无头模式下运行浏览器时,所提供的HTML可能不同于无头运行的浏览器。换句话说,DOM元素上的属性可以有不同的名称,并且由于您使用这些属性来自动执行选择和单击等操作,因此您的代码将需要更改。出于这个原因,通过浏览器检查元素是一个很好的起点,但是当在无头模式下运行时,您可能需要调整属性的名称,因此这对入门很有帮助。例如,下面的代码摘录显示了为Puppeteer编写的两种登录Google的相同代码。一个是无头的,另一个是无头的:
无头模式:
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.goto('https://takeout.google.com');
await page.waitForSelector('input[type=email]')
await page.type('input[type=email]', process.env.GOOGLE_USER)
await page.click('#next')
await page.waitForSelector('#Passwd', { visible: true })
await page.type('#Passwd', process.env.GOOGLE_PWD);
await page.waitForSelector('#signIn', { visible: true })
await page.click('#signIn');
await page.waitForNavigation()
await browser.close();
})();非头模式:
(async () => {
const browser = await puppeteer.launch({ headless: false, slowMo: 50 })
const page = await browser.newPage()
await page.goto('https://takeout.google.com');
await page.waitForSelector('input[type="email"]')
await page.type('input[type="email"]', process.env.GOOGLE_USER)
await page.click('#identifierNext')
await page.waitForSelector('input[type="password"]', { visible: true })
await page.type('input[type="password"]', process.env.GOOGLE_PWD)
await page.waitForSelector('#passwordNext', { visible: true })
await page.click('#passwordNext')
await page.waitForNavigation()
await browser.close()
})()https://stackoverflow.com/questions/54316824
复制相似问题