我想从网站上抓取文本(“显示650个结果”)。
我正在寻找的结果是:
Result : Showing 650 results
以下是Html代码:
<div class="jobs-search-results__count-sort pt3">
<div class="jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4">
Showing 650 results
</div>
Python代码:
response = requests.get(index_url)
soup = BeautifulSoup(response.text, 'html.parser')
text = {}
link = "jobs-search-results__count-string results-count-string Sans-15px-black-55% pb0 pl5 pr4"
for div in soup.find_all('div',attrs={"class" : link}):
text[div.text]
text
到目前为止,我的代码看起来不能正常工作。
发布于 2017-08-02 00:14:30
soup.find_all
如果您只寻找一个元素,soup.find
同样适用tag.string
/tag.contents
/tag.text
访问内部文本div = soup.find('div', {"class" : link})
text = div.string
发布于 2021-11-14 04:25:45
旧:from BeautifulSoup import BeautifulSoup
“美丽汤3.x系列的开发已于2011年结束,该系列将于2021年1月1日,即Python 2日落日期一年后停产。”
新:from bs4 import BeautifulSoup
Beautiful Soup是一个库,它使从网页中抓取信息变得容易。它建立在HTML或XML解析器之上,为迭代、搜索和修改解析树提供Python化的习惯用法。
https://stackoverflow.com/questions/45449380
复制