腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
getall
()
获取
xPath
属性
、
我正在
使用
Scrapy
获取
一个in的构建列表(稍后将在URL中
使用
它来抓取更多数据): def parse(self, response): print(a) item["itemId
浏览 160
提问于2020-04-23
得票数 0
3
回答
使用
xpath
Scrapy从列表中提取要素
、
、
、
我一直在尝试从该
获取
所有
属性
信息和功能response.
xpath
('//div[@id="property-info-col1"]/text()').
getall
() response.
xpath
('//div[@class="col-md-6"]&
浏览 0
提问于2021-03-24
得票数 0
2
回答
用节点的绝对路径作为列名将多级xml提取到熊猫数据中
、
、
、
我有一个具有多级节点的巨大xml,我正在尝试将数据解析成熊猫数据。`<?xml version="1.0" encoding="UTF-8"?> <TestCode ID="1"> <Blant> <app_s>2</ap
浏览 1
提问于2020-05-15
得票数 0
2
回答
在scrapy中
使用
response.
xpath
()或response.css时不打印文本
我正在尝试
使用
scrapy从网站提取文本,当我
使用
print("hello") data = response.
xpath
('//div[@class="content-blog</div> 当我
使用
response.css()时也会发生同样的事情。 我要提取的文本位于<div class="content-blog">标记下的多个<p>标记中。如何才能只从网站<e
浏览 29
提问于2020-07-22
得票数 0
回答已采纳
1
回答
AttributeError:'list‘对象没有'replace’Selenium Python
属性
、
、
、
我在
使用
replace()函数时遇到
属性
错误 AttributeError: 'list' object has no attribute 'replace' 我正在尝试用一个空字符串替换[和'。owner_address = response.
xpath
('
XPATH
Expression').
getall
().replace("[", "").replace("'"
浏览 70
提问于2020-08-23
得票数 1
回答已采纳
1
回答
抓取选择器:
获取
元素的n个子文本。
、
、
、
、
我
使用
Scrapy选择器从html中提取字段。
xpath
= /html/body/path/to/element/text()是否可以直接指定在
x
浏览 2
提问于2020-01-07
得票数 0
回答已采纳
1
回答
用
XPath
表达式从HTML span元素中提取全文
、
、
、
、
</span>//div[@data-hook="review"]//div[@data-hook="review-collapsed"]/span
浏览 22
提问于2021-02-28
得票数 0
1
回答
使用
带有Scrapy的CSS选择器
获取
子标记的文本,什么也不返回。
、
for-shops *::text').get() 甚至还有
xpath
:p.
xpath
('/&
浏览 3
提问于2022-12-04
得票数 0
回答已采纳
1
回答
使用
xpath
从
属性
中提取
属性
id
、
、
、
、
我一直试图从以下网站提取
属性
id:<div class="corner-ribbon"> </a>response
浏览 2
提问于2020-12-13
得票数 1
回答已采纳
1
回答
只
获取
for循环中的第一个元素
、
、
、
、
我不明白为什么下面的代码在
使用
Scrapy Selector时不能工作。p> </li></html>''' first = elem.
xpath
浏览 1
提问于2022-06-02
得票数 -1
2
回答
Python刮取dt和dd值
、
、
、
我试图在一个网站上
获取
dt/dd表格结构中的所有数据。mijesano-mljeveno-meso-pakirano-850-g-pik"] dt_list = response.
xpath
dt_list: productTable["Opisna_tablica"] = dt.
xpath
/text()&
浏览 3
提问于2020-08-09
得票数 1
回答已采纳
1
回答
从
xpath
/css
获取
输出的困难
、
、
、
、
下面是我正在抓取的一个示例链接:我正在尝试
获取
互联网号码,我尝试了css和
xpath
productOMS = product.
xpath
("//span[@id='product_ID']").
getall
()productOMS = product.css(".product_internet_number::text").
getall
() 下面是我想要抓取的html片段:<sp
浏览 4
提问于2020-03-05
得票数 0
回答已采纳
2
回答
For循环不会抓取所有项,只需要一个
、
、
我已经多次尝试更改
xpath
,但我认为我对此还太陌生,无法确定问题出在哪里。当我从for循环中取出所有路径时,它会很好地删除所有内容,但它的格式不允许我将数据传输到csv文件。://www.pajhwok.com/en/security-crime'] container = response.
xpath
("//div[@id='taxonomy-page-block']"
浏览 20
提问于2020-07-22
得票数 0
回答已采纳
2
回答
如何
使用
css选择器获得带有方括号的html标记
属性
?
、
、
、
、
:'invisible'" class="">222222222</span> 我
使用
Scrapy和CSS选择器来解析数据。但我不知道怎么弄到电话或传真号码。在这两种情况下,Itemprop都是相同的,因此不能
使用
它。那么,如何选择具有[class]="revealtel?'':'invisible'或[class]="revealmainfax?'':'invisible'
浏览 4
提问于2022-06-25
得票数 0
回答已采纳
2
回答
使用
Scrapy实现高效的数据循环
、
、
、
我已经编写了直接
获取
所有数据的代码,但是当我试图在循环结构中转换相同的数据以逐个
获取
数据时,我
使用
了一些循环结构的issues.The来帮助我轻松地将这些数据放入DB中。[@class='table-header']/h2/a/text()"competition_columns = response.
xpath
@class="responsive-table"
浏览 8
提问于2020-03-10
得票数 1
回答已采纳
1
回答
使用
Scrapy抓取下拉列表
、
、
我正在尝试
使用
Scrapy抓取一个具有以下源代码格式的下拉列表。
浏览 35
提问于2020-06-22
得票数 0
1
回答
使用
xpath
text()函数从子元素/节点提取所有文本
、
、
、
我正在
使用
刮除,并希望得到所有的文本为儿童节点。我奉命去拿课文我期待的结果是:“1-120 u”<span id="response.
xpath
('//div[@class="A"]/text()').
getall<
浏览 0
提问于2021-03-15
得票数 0
回答已采纳
1
回答
Xpath
-查找div类中的特定元素。
、
、
使用
Scrapy,我在网站上搜索有趣的文章,并可以
使用
以下方法“找到”所需的div类:此外,我想得到的日期张贴,这是上面的div类(日期pretyDate契约)。
浏览 7
提问于2022-01-09
得票数 0
1
回答
XPath
选择器返回空列表
我正在尝试从商店中刮取数据:但是,当谈到获得例如黄金的价值时,我只得到空的列表: gold= response.
xpath
('/html/body/div[3]/div[1]
浏览 1
提问于2020-08-28
得票数 0
回答已采纳
1
回答
Scrapy忽略了部分文本
、
、
、
我正在尝试
使用
Scrapy从网站上抓取文本,并构建一个文本数据集和它的一些功能。对于每个包含文本的元素,我将保存文本本身、元素类型和其他一些内容。Nested text, element: b我负责抓取文本的代码的一部分: ... 我怎么
浏览 4
提问于2021-12-20
得票数 -1
回答已采纳
点击加载更多
相关
资讯
jQuery - 获取内容和属性
获取对象属性类型、属性名称、属性值的研究:反射和JEXL解析引擎
python的类(一)—获取对象信息,实例属性和类属性
使用XPath进行网页爬取的Python实现
Python爬虫,登陆神器Selenium之xpath的使用
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券