前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >python爬取图床壁纸

python爬取图床壁纸

作者头像
懿曲折扇情
发布2022-08-24 12:21:10
发布2022-08-24 12:21:10
32200
代码可运行
举报
文章被收录于专栏:建帅技术分享建帅技术分享
运行总次数:0
代码可运行
代码语言:javascript
代码运行次数:0
运行
复制
# coding=utf-8
"""
    作者:gaojs
    功能:
    新增功能:
    日期:2022/5/13 20:14
"""
import os.path
import json
import pprint

import re

import requests
from faker import Factory


def get_random_ua():
    """
    获取随机UA
    """
    fact = Factory.create()
    ua = fact.user_agent()
    return ua


def get_photo():
    """
    爬取华灯上博客的图床信息
    """
    if not os.path.exists('photo/'):
        os.mkdir('photo/')
    random_ua = get_random_ua()
    # url = 'https://mengkai.fun:88/album/C7X'
    # 翻页操作
    for page in range(1, 10):
        url = f'https://mengkai.fun:88/album/C7X/?sort=date_desc&page={page}'
        headers = {
            'user-agent': random_ua
        }
        rsp = requests.get(url=url, headers=headers, timeout=50)
        # print(rsp.text)
        # 获取图片标题
        photo_name = re.findall('<a href=".*?" class="list-item-desc-title-link" data-text="image-title" data-content="image-link">(.*?)</a>', rsp.text)
        photo_list = list(photo_name)
        for photo in photo_list:
            photo_title = photo
            # print(photo_title)

        # 获取图片url
        url_title = re.findall('<img src="(.*?)" alt="(.*?)" width="500" height="281">', rsp.text)
        list_url_title = list(url_title)
        # print(list_url_title)
        for index in list_url_title:
            new_url = index[0]
            url_rfind = new_url[:new_url.rfind('/')]
            end_url = index[1]
            new_url_content = url_rfind + '/' + end_url
            print(new_url_content)
            # print(new_url)
            # 下载图床图片到本地
            content_photo = requests.get(new_url_content, headers=headers, timeout=50).content
            with open('photo/' + end_url, mode='wb') as f:
                print(f'******************************正在下载 {end_url} ****************************')
                f.write(content_photo)


def get_page():
    """
    翻页操作
    """
    pass


get_photo()
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档