首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何在python中使用scrapy从span获取文本?

如何在python中使用scrapy从span获取文本?
EN

Stack Overflow用户
提问于 2017-08-29 14:50:35
回答 2查看 6.1K关注 0票数 5

我将HTML代码放在这里:

代码语言:javascript
代码运行次数:0
运行
复制
<div class="rendering rendering_person rendering_short rendering_person_short">
  <h3 class="title">
    <a rel="Person" href="https://moh-it.pure.elsevier.com/en/persons/massimo-eraldo-abate" class="link person"><span>Massimo Eraldo Abate</span></a>
  </h3>
  <ul class="relations email">
    <li class="email"><a href="massimo.abate@ior.it" class="link"><span>massimo.abate@ior.it</span></a></li>
  </ul>
  <p class="type"><span class="family">Person: </span>Academic</p>
</div>

从上面的代码中如何提取Massimo Eraldo Abate?

请帮帮我。

EN

回答 2

Stack Overflow用户

发布于 2017-08-29 14:58:36

您可以使用以下命令提取名称

代码语言:javascript
代码运行次数:0
运行
复制
response.xpath('//h3[@class="title"]/a/span/text()').extract_first()

另外,请看这个Scrapinghub的blogpost以了解XPath的介绍。

票数 5
EN

Stack Overflow用户

发布于 2017-08-29 14:59:50

请看一下这一页。提取文本scrapy docs的方法有很多种

代码语言:javascript
代码运行次数:0
运行
复制
>>> body = '<html><body><span>good</span></body></html>'
>>> Selector(text=body).xpath('//span/text()').extract()

>>> response = HtmlResponse(url='http://example.com', body=body)
>>> Selector(response=response).xpath('//span/text()').extract()
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/45932513

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档