首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python爬虫-beautifulsoup使用

    python爬取天气 概述 对beautifulsoup的简单使用,beautifulsoup是爬虫中初学者使用的一个第三方库,操作简单,代码友好。...将代码包含到函数中,通过调用函数,实现重复爬取 代码 import requests from bs4 import BeautifulSoup # pandas库,用于保存数据,同时这也是基础库 import...'].str.split('/',expand=True)[0] df['最低温度']=df['温度'].str.split('/',expand=True)[1] # 通过map函数对温度中的℃进行替换并转换为数字.../python/爬取天气数据/beijing.csv',index=False,encoding='utf-8') # 用到时的读取 pd.read_csv('..../python/爬取天气数据/beijing.csv') 结束语 关于爬虫的所有项目均为实践项目,没有理论,想法是基础理论很容易过期,啃教材感觉有点费力,好多项目都变更了,而且有些爬虫是基于python2

    1.3K20

    ​Python爬虫-BeautifulSoup详解

    官方链接奉上,https://beautifulsoup.readthedocs.io/zh_CN/latest/ 安装BeautifulSoup4 启动cmd 输入pip3 install beautifulsoup4...pip3表示Python3版本,不需要区分版本直接使用pip 安装成功后截图如下: ?...BeautifulSoup 将 HTML 文档转换成一个树形结构,每个节点都是 Python 对象,所有对象可以归纳为4种: Tag NavigableString BeautifulSoup Comment...Python系列 Python系列会持续更新,从基础入门到进阶技巧,从编程语法到项目实战。若您在阅读的过程中发现文章存在错误,烦请指正,非常感谢;若您在阅读的过程中能有所收获,欢迎一起分享交流。...如果你也想和我一起学习Python,关注我吧! 学习Python,我们不只是说说而已 End

    1.8K30

    python爬虫之BeautifulSoup

    文章目录 1. python爬虫之BeautifulSoup 1.1. 简介 1.2. 安装 1.3. 创建BeautifulSoup对象 1.4. Tag 1.4.1....参考文章 python爬虫之BeautifulSoup 简介 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。...安装 pip install BeautifulSoup4 easy_install BeautifulSoup4 创建BeautifulSoup对象 首先应该导入BeautifulSoup类库...还可以直接使用print soup.p['class'] get get方法用于得到标签下的属性值,注意这是一个重要的方法,在许多场合都能用到,比如你要得到img src="#">标签下的图像url...,那么就可以用soup.img.get('src'),具体解析如下: print soup.p.get("class") #得到第一个p标签下的src属性 string 得到标签下的文本内容

    1.3K20

    Python爬虫(三):BeautifulSoup库

    BeautifulSoup 是一个可以从 HTML 或 XML 文件中提取数据的 Python 库,它能够将 HTML 或 XML 转化为可定位的树形结构,并提供了导航、查找、修改功能,它会自动将输入文档转换为...BeautifulSoup 支持 Python 标准库中的 HTML 解析器和一些第三方的解析器,默认使用 Python 标准库中的 HTML 解析器,默认解析器效率相对比较低,如果需要解析的数据量比较大或比较频繁...看一下主要解析器和它们的优缺点: 解析器 使用方法 优势 劣势 Python标准库 BeautifulSoup(markup,"html.parser") Python的内置标准库;执行速度适中;文档容错能力强...,每个节点都是 Python 对象,所有对象可以归纳为4种:Tag,NavigableString,BeautifulSoup,Comment。...NavigableString 类是用来包装 tag 中的字符串内容的,使用 .string 来获取字符串内容,示例如下: str = tag.string 可以使用 replace_with() 方法将原有字符串内容替换成其它内容

    1.9K20

    Python爬虫基础七:BeautifulSoup

    soup = bs4.BeautifulSoup(text, 'html.parser') 接着,就可以定位了,尽量根据id定位,当然,根据类名也是可以的,这个小实战就适合类名定位。...image_urls = soup.select('.clearfix li a img') # 注意.clearfix和li中间是有空格的 这个定位的目的就是先找到类名为clearfix 的节点,在找到它下面名为...li的子节点,再找到a节点,再找到img节点 打印一下,可以看到是一个列表,那么久需要对列表进行遍历,得到每一个结果。...'https://pic.netbian.com/4kqiche/' response = requests.get(url=url) text = response.text soup = bs4.BeautifulSoup...(text, 'html.parser') image_urls = soup.select('.clearfix li a img') # 注意.clearfix和li中间是有空格的 for i in

    72240
    领券