首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Phantomjs加载与铬不同的页面。

Phantomjs加载与铬不同的页面。
EN

Stack Overflow用户
提问于 2018-08-03 14:16:12
回答 2查看 48关注 0票数 1

我正在尝试从以下链接下载html:

http://matchhistory.na.leagueoflegends.com/en/#match-details/TRLH3/1000430019?gameHash=a5e39c76a8e91ba9&tab=stats

当我在chrome中打开时,它会将所有想要下载的数据加载到html中。我想用幻影打开这些页面,但它们加载的不一样吗?我正在使用下面的代码来拍摄幻影加载的截图。它只是主要的匹配历史页面:http://matchhistory.na.leagueoflegends.com/en

代码语言:javascript
运行
AI代码解释
复制
var page = require('webpage').create();
var url="http://matchhistory.na.leagueoflegends.com/en/#match-details/TRLH3/1000430019?gameHash=a5e39c76a8e91ba9&tab=stats";
console.log('The default user agent is ' + page.settings.userAgent);
page.settings.userAgent = 'SpecialAgent';

page.open(url, function(status) {

  if (status !== 'success') {
     console.log('Unable to access network');
  }

 setTimeout(function (){page.render('mh.png');},1000);
 setTimeout(function (){phantom.exit();},1200);
  });

我不知道他们为什么提出两种不同的东西。我怎样才能让pahntomjs渲染相同的东西呢?

提前感谢

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-08-03 19:56:06

正如@andrew所指出的,之所以会发生这种情况,是因为PhantomJS在处理重定向时删除了片段。存在一个问题(https://github.com/ariya/phantomjs/issues/12192)和为修复(https://github.com/ariya/phantomjs/pull/14941)创建的拉请求,但由于PhantomJS暂停了开发(https://github.com/ariya/phantomjs/issues/15344),这些请求尚未发布。

另一种方法是使用木偶词典(https://github.com/GoogleChrome/puppeteer),它有一个关于如何捕捉截图的用法示例。

在您的例子中,这可以像安装Puppeteer一样简单:

代码语言:javascript
运行
AI代码解释
复制
npm install puppeteer

然后将代码更新为:

代码语言:javascript
运行
AI代码解释
复制
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto('http://matchhistory.na.leagueoflegends.com/en/#match-details/TRLH3/1000430019?gameHash=a5e39c76a8e91ba9&tab=stats');
  await page.screenshot({path: 'mh.png'});
  await browser.close();
})();

并通过node而不是phantomjs运行代码。

代码语言:javascript
运行
AI代码解释
复制
node <filename>.js

网站有更多关于可以配置的信息(视图、端口等)。

票数 0
EN

Stack Overflow用户

发布于 2018-08-03 17:25:46

您的http链接可能被重定向到https。我的猜测是,phantom.js没有保留片段标识符( #match-details)或重定向之后的任何内容,这就是为什么要获取主页http://matchhistory.na.leagueoflegends.com/en的原因。

要解决您的问题,请使用https链接,因为您不会被重定向,这将有效。

代码语言:javascript
运行
AI代码解释
复制
var url="https://matchhistory.na.leagueoflegends.com/en/#match-details/TRLH3/1000430019?gameHash=a5e39c76a8e91ba9&tab=stats";
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51680681

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文