Webscraping Selenium和PhantomJS返回产品详细信息的文本

文章/答案/技术大牛

发布

1回答

、、、、

我是一个用python抓取网页的新手，我正在尝试使用Selenium和phantomJS检索网页的产品详细信息文本，因为当我使用"driver.page_source“时，这个页面不会显示呈现的htmlpage=1'driver.get(url) html = driver.page_source 不巧的是，这样做我

浏览 17提问于2020-06-18得票数 0

回答已采纳

1回答

Selenium无法连接到GhostDriver (但有时)

、、、

我在Python / Selenium和PhantomJS中设置了一个简单的webscraping脚本。我总共有200个网址要刮。脚本一开始运行良好，然后在大约20-30个URL之后运行(当它失败时，它看起来可能是随机的，并且与任何特定的URL无关)，我在python中得到了以下错误： selenium.common.exceptions.WebDriverException: Message: 'Can not connect t

浏览 12提问于2014-07-04得票数 9

回答已采纳

1回答

如何使用webdriver (Java)在phantomjs上禁用字体抗锯齿？

、、、、

我正在尝试编写检查布局问题的Selenium测试。为此，我在Java端使用Selenium Webdriver，并使用phantomjs作为“浏览器”。我想使用phantomjs，因为它能够制作实际渲染组件的屏幕截图。默认情况下，phantomjs使用抗锯齿渲染文本，这使得扫描文本变得困难(查找文本基线和执行简单的OCR)。如何告诉phantomJS不要使用抗锯

浏览 1提问于2017-09-02得票数 0

1回答

使用Selenium在Google中输入搜索文本

、

我想去谷歌，用Selenium + Python输入"Hello“。from selenium import webdriverimport json driver = webdriver.PhantomJS(executable_path='/usr/local/lib/node_modules/phantomjs/lib/phantom/bin/phantomjs&

浏览 1提问于2014-10-07得票数 0

回答已采纳

2回答

org.openqa.selenium.os.CommandLine.find(Ljava/lang/String;)Ljava/lang/String；：java.lang.NoSuchMethodError:在使用PhantomJS 2.1.1时使用Selenium

、、、

OS - Windows 7Selenium - 3.8.1(selenium-server)。JDK - 1521)初始化驱动程序：WebDriver driver = new

浏览 8提问于2017-12-10得票数 1

回答已采纳

3回答

如何使用Python使用Selenium从多个div类中提取文本

、、

我试图从中获取文本类的价格值for ratevalue in rateText:未发现结果：回溯(最近一次调用)：文件"D:\project\totempop\webscrapingrateText=WebDriverWait(驱动程序，rateText=WebDriverWait‘//divstarts with(@class，“pr

浏览 11提问于2022-04-21得票数 1

4回答

omegle lxml擦伤不起作用

、、、

strong> </strong> 现在，我假设使用LXML将是//div[@id="onlinecount"]来刮取标签中的任何文本，但当我试图刮取这些数字时，我只会得到一个空的列表。以下是我的相关代码：site = requ

浏览 5提问于2014-01-07得票数 1

回答已采纳

1回答

如何从不使用POST的网站上刮取信息

、、、

我需要从一个使用HTML选择过滤其内容的网站获得一些信息。然而，我有困难这样做，因为当改变的价值从选择，网站没有‘重新加载’它使用一些内部功能来做得到新的内容。所讨论的网页是，如果我使用Chrome工具来查看当我更改select值时会发生什么。我接到一个像这样的电话。有趣的是，uid是select选项的i

浏览 1提问于2018-09-02得票数 1

回答已采纳

1回答

无法从python selenium提取文本

、、、

我写了下面的代码来提取url的价格细节。from selenium import webdriverdcap["phantomjs.page.settings.userAgent"] = ('Mozilla/5.0，尽管我们在

浏览 1提问于2016-10-26得票数 0

0回答

使用python和selenium连接到phantomJs webdriver时出现问题

、、、

我尝试在使用selenium和phantomjs的linux服务器上运行python脚本；但是，我一直收到以下错误消息：下面是一个简单的测试脚本，它会失败并生成此错误：from selenium import webdriver 调用路径上的</em

浏览 2提问于2016-07-13得票数 6

回答已采纳

3回答

Python:使用PhantomJS空页面源代码的Selenium

、、

当我想要获取URL页面的源代码时，在Windows7上使用Selenium和PhantomJS遇到了问题。browser.page_source仅返回<html><head></head></html>。我在browser.page_source之前先睡了一觉，但它没有帮助。这是我的代码：browser = webdriver.PhantomJS</

浏览 95提问于2014-05-10得票数 19

回答已采纳

1回答

获取PhantomJS返回Selenium驱动的状态码

、、

我正在编写Java代码，它使用Selenium Web Driver和PhantomJS作为浏览器来访问站点。我的要求是，我应该能够检索每个站点返回的状态代码。在阅读了几篇可用文章之后，Selenium Web Driver似乎没有这项规定。但是PhantomJS有返回状态码的OnResourceReceived接口。我如何才能将OnResourceReceived与Selenium Web Dr

浏览 1提问于2014-07-29得票数 3

2回答

用Python和selenium抓取URL

、、、

我正在尝试让python selenium脚本工作，它应该执行以下操作： from selenium.webdriver.support.ui import WebDriverWa

浏览 0提问于2019-09-08得票数 2

回答已采纳

1回答

在python 3中找不到含硒的元素

、、

我正在使用selenium做一些WebScraping，但是检测不到包含xpath、完整xpath、id或文本的元素。<ul></div> 我想从里面获取东西，但是不能，我可以用xpath和id定位到"cbp-vm-switcher“的东西。

浏览 10提问于2021-07-18得票数 0

1回答

Phantomjs失败，但在Chrome和Firefox中测试正常

、、

我使用selenium-webdriver javascript包进行了一个简单的测试，该包通过名称查找文本字段并输入文本。该测试在Firefox和Chrome上运行良好，但在Phantomjs上失败。我还尝试通过xpath和id查找元素，但在Phantomjs中总是失败。有没有人有类似的经验，可以给我指出正确的调试方向？谢谢

浏览 0提问于2014-06-15得票数 2

1回答

Python3 + selenium* + PhantomJS UnicodeDecodeError*

、、

环境 browser = webdriver.PhantomJS() //引发一个UnicodeDecodeError问题回溯(最近一次调用)：文件"d:/devtools/pha

浏览 8提问于2017-12-07得票数 2

回答已采纳

2回答

如何在JavaScript应用程序中使用PhantomJS的Java

、、、、

我想用Java写一个应用程序，它应该在一个无头浏览器中测试一个网站，比如PhantomJS或zombie.js。PhantomJS脚本是用JavaScript编写的，那么如何在我的JavaScript应用程序中使用PhantomJS提供的Java，而不使用Selenium和GhostDriver呢？这和图书馆Nashorn有关吗？创建一个HT

浏览 0提问于2014-10-01得票数 0

3回答

以编程方式获取web请求启动器

、、、、

我希望能够以编程的方式获取网络请求发起者信息，这样我就可以运行一个带有url和request search string参数的脚本，并且它将返回每个带有url匹配request search string的请求来自url页面的详细信息。/libs/jquery/1.7.1/jquery.min.js / 4291 http://www.google-analytics.com/analytics.j

浏览 4提问于2015-11-26得票数 15

2回答

无法单击带有js后端的下载链接。

、、、、

在下载csv文件的网站上有一个链接。该链接位于一个表中，但实际下载链接是隐藏的。ford.csv</a> </tr> </div>我正在尝试通过使用python/seleniumfrom selenium import webdriver driver = w

浏览 4提问于2019-11-10得票数 1

回答已采纳

1回答

PhantomJS意外地退出Selenium : WebDriverException，状态代码为127

、、、

我在Mac上使用了一个全局PhantomJS，用于多个Javascript和Python项目。返回全局selenium :/Users/Me/..npm packages/bin/幻影Medriver = webdriver.PhantomJS(executable_path/site-packages/selenium/webdriver/phantomjs&

浏览 2提问于2016-10-18得票数 7

回答已采纳

点击加载更多