使用getall()获取xPath属性

文章/答案/技术大牛

发布

1回答

、

我正在使用Scrapy获取一个in的构建列表(稍后将在URL中使用它来抓取更多数据)： def parse(self, response): print(a) item["itemId

浏览 160提问于2020-04-23得票数 0

3回答

使用xpath Scrapy从列表中提取要素

、、、

我一直在尝试从该获取所有属性信息和功能response.xpath('//div[@id="property-info-col1"]/text()').getall() response.xpath('//div[@class="col-md-6"]&

浏览 0提问于2021-03-24得票数 0

2回答

用节点的绝对路径作为列名将多级xml提取到熊猫数据中

、、、

我有一个具有多级节点的巨大xml，我正在尝试将数据解析成熊猫数据。`<?xml version="1.0" encoding="UTF-8"?> <TestCode ID="1"> <Blant> <app_s>2</ap

浏览 1提问于2020-05-15得票数 0

2回答

在scrapy中使用response.xpath()或response.css时不打印文本

我正在尝试使用scrapy从网站提取文本，当我使用 print("hello") data = response.xpath('//div[@class="content-blog</div> 当我使用response.css()时也会发生同样的事情。我要提取的文本位于<div class="content-blog">标记下的多个<p>标记中。如何才能只从网站<e

浏览 29提问于2020-07-22得票数 0

回答已采纳

1回答

AttributeError：'list‘对象没有'replace’Selenium Python属性

、、、

我在使用replace()函数时遇到属性错误 AttributeError: 'list' object has no attribute 'replace' 我正在尝试用一个空字符串替换[和'。owner_address = response.xpath('XPATH Expression').getall().replace("[", "").replace("'"

浏览 70提问于2020-08-23得票数 1

回答已采纳

1回答

抓取选择器:获取元素的n个子文本。

、、、、

我使用Scrapy选择器从html中提取字段。xpath = /html/body/path/to/element/text()是否可以直接指定在x

浏览 2提问于2020-01-07得票数 0

回答已采纳

1回答

用XPath表达式从HTML span元素中提取全文

、、、、

</span>//div[@data-hook="review"]//div[@data-hook="review-collapsed"]/span

浏览 22提问于2021-02-28得票数 0

1回答

使用带有Scrapy的CSS选择器获取子标记的文本，什么也不返回。

、

for-shops *::text').get() 甚至还有xpath：p.xpath('/&

浏览 3提问于2022-12-04得票数 0

回答已采纳

1回答

使用xpath从属性中提取属性id

、、、、

我一直试图从以下网站提取属性id：<div class="corner-ribbon"> </a>response

浏览 2提问于2020-12-13得票数 1

回答已采纳

1回答

只获取for循环中的第一个元素

、、、、

我不明白为什么下面的代码在使用Scrapy Selector时不能工作。p> </li></html>''' first = elem.xpath

浏览 1提问于2022-06-02得票数 -1

2回答

Python刮取dt和dd值

、、、

我试图在一个网站上获取dt/dd表格结构中的所有数据。mijesano-mljeveno-meso-pakirano-850-g-pik"] dt_list = response.xpathdt_list: productTable["Opisna_tablica"] = dt.xpath/text()&

浏览 3提问于2020-08-09得票数 1

回答已采纳

1回答

从xpath/css获取输出的困难

、、、、

下面是我正在抓取的一个示例链接：我正在尝试获取互联网号码，我尝试了css和xpathproductOMS = product.xpath("//span[@id='product_ID']").getall()productOMS = product.css(".product_internet_number::text").getall() 下面是我想要抓取的html片段：<sp

浏览 4提问于2020-03-05得票数 0

回答已采纳

2回答

For循环不会抓取所有项，只需要一个

、、

我已经多次尝试更改xpath，但我认为我对此还太陌生，无法确定问题出在哪里。当我从for循环中取出所有路径时，它会很好地删除所有内容，但它的格式不允许我将数据传输到csv文件。://www.pajhwok.com/en/security-crime'] container = response.xpath("//div[@id='taxonomy-page-block']"

浏览 20提问于2020-07-22得票数 0

回答已采纳

2回答

如何使用css选择器获得带有方括号的html标记属性？

、、、、

:'invisible'" class="">222222222</span> 我使用Scrapy和CSS选择器来解析数据。但我不知道怎么弄到电话或传真号码。在这两种情况下，Itemprop都是相同的，因此不能使用它。那么，如何选择具有[class]="revealtel?'':'invisible'或[class]="revealmainfax?'':'invisible'

浏览 4提问于2022-06-25得票数 0

回答已采纳

2回答

使用Scrapy实现高效的数据循环

、、、

我已经编写了直接获取所有数据的代码，但是当我试图在循环结构中转换相同的数据以逐个获取数据时，我使用了一些循环结构的issues.The来帮助我轻松地将这些数据放入DB中。[@class='table-header']/h2/a/text()"competition_columns = response.xpath@class="responsive-table"

浏览 8提问于2020-03-10得票数 1

回答已采纳

1回答

使用Scrapy抓取下拉列表

、、

我正在尝试使用Scrapy抓取一个具有以下源代码格式的下拉列表。

浏览 35提问于2020-06-22得票数 0

1回答

使用xpath* text()函数从子元素/节点提取所有文本*

、、、

我正在使用刮除，并希望得到所有的文本为儿童节点。我奉命去拿课文我期待的结果是：“1-120 u”<span id="response.xpath('//div[@class="A"]/text()').getall<

浏览 0提问于2021-03-15得票数 0

回答已采纳

1回答

Xpath -查找div类中的特定元素。

、、

使用Scrapy，我在网站上搜索有趣的文章，并可以使用以下方法“找到”所需的div类：此外，我想得到的日期张贴，这是上面的div类(日期pretyDate契约)。

浏览 7提问于2022-01-09得票数 0

1回答

XPath选择器返回空列表

我正在尝试从商店中刮取数据：但是，当谈到获得例如黄金的价值时，我只得到空的列表： gold= response.xpath('/html/body/div[3]/div[1]&#x

浏览 1提问于2020-08-28得票数 0

回答已采纳

1回答

Scrapy忽略了部分文本

、、、

我正在尝试使用Scrapy从网站上抓取文本，并构建一个文本数据集和它的一些功能。对于每个包含文本的元素，我将保存文本本身、元素类型和其他一些内容。Nested text, element: b我负责抓取文本的代码的一部分： ... 我怎么

浏览 4提问于2021-12-20得票数 -1

回答已采纳

点击加载更多