Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >手把手教你抖音系列视频批量下载器开发

手把手教你抖音系列视频批量下载器开发

作者头像
Python进阶者
发布于 2022-03-10 07:51:39
发布于 2022-03-10 07:51:39
2.2K00
代码可运行
举报
运行总次数:0
代码可运行

📢博客主页:https://blog.csdn.net/as604049322 📢本文由 小小明-代码实体 原创,首发于 CSDN🙉 📢未来很长,值得我们全力奔赴更美好的生活✨

程序使用演示

大家好,我是小小明。这里开发了一个抖音视频下载器,打开效果如下:

如果本地的谷歌游览器之前从来没有访问过抖音主页,点击开始下载按钮会有如下输出:

此时我们只需要点击 访问抖音主页,程序则会使用本地的谷歌游览器访问抖音主页。再次点击下载按钮:

可以看到该视频是一个合集视频:

那么程序只需要勾选第一个选项即可下载整个合集:

这样一次性就将整个合集都下载下来了:

开发流程

首先根据上一篇文章:提取谷歌游览器Cookie的五重境界

读取谷歌游览器安装的位置和本地抖音相关的cookie:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
"""
小小明的代码
CSDN主页:https://blog.csdn.net/as604049322
"""
__author__ = '小小明'
__time__ = '2022/1/23'

import base64
import json
import os
import sqlite3
import winreg

import win32crypt
from cryptography.hazmat.primitives.ciphers.aead import AESGCM


def load_local_key(localStateFilePath):
    "读取chrome保存在json文件中的key再进行base64解码和DPAPI解密得到真实的AESGCM key"
    with open(localStateFilePath, encoding='u8') as f:
        encrypted_key = json.load(f)['os_crypt']['encrypted_key']
    encrypted_key_with_header = base64.b64decode(encrypted_key)
    encrypted_key = encrypted_key_with_header[5:]
    key = win32crypt.CryptUnprotectData(encrypted_key, None, None, None, 0)[1]
    return key


def decrypt_value(key, data):
    "AESGCM解密"
    nonce, cipherbytes = data[3:15], data[15:]
    aesgcm = AESGCM(key)
    plaintext = aesgcm.decrypt(nonce, cipherbytes, None).decode('u8')
    return plaintext


def fetch_host_cookie(host):
    "获取指定域名下的所有cookie"
    userDataDir = os.environ['LOCALAPPDATA'] + r'\Google\Chrome\User Data'
    localStateFilePath = userDataDir + r'\Local State'
    cookiepath = userDataDir + r'\Default\Cookies'
    # 97版本已经将Cookies移动到Network目录下
    if not os.path.exists(cookiepath) or os.stat(cookiepath).st_size == 0:
        cookiepath = userDataDir + r'\Default\Network\Cookies'
    # print(cookiepath)
    sql = f"select name,encrypted_value from cookies where host_key like '%.{host}'"
    cookies = {}
    key = load_local_key(localStateFilePath)
    with sqlite3.connect(cookiepath) as conn:
        cu = conn.cursor()
        for name, encrypted_value in cu.execute(sql).fetchall():
            cookies[name] = decrypt_value(key, encrypted_value)
    return cookies


def get_chrome_path():
    try:
        key = winreg.OpenKey(winreg.HKEY_CLASSES_ROOT, r"ChromeHTML\Application")
        path = winreg.QueryValueEx(key, "ApplicationIcon")[0]
        chrome_path = path[:path.rfind(",")]
        return chrome_path
    except FileNotFoundError as e:
        return


if __name__ == '__main__':
    print(fetch_host_cookie("douyin.com"))
    print(get_chrome_path())

有了这个工具类,我们就不再需要使用selenium。

然后是视频解析的核心代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def get_video_url(url, cookies):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36",
        "referer": "https://www.douyin.com"
    }
    res = requests.get(url, headers=headers, cookies=cookies)
    if res.status_code == 200:
        RENDER_DATA, = re.findall(
            r'<script id="RENDER_DATA" type="application/json">([^<>]+)</script>', res.text)
        data = json.loads(unquote(RENDER_DATA))
        key = '8' if url.find("collection") != -1 else '34'
        try:
            detail = data[key]['aweme']['detail']
            title = detail['desc']
        except Exception as e:
            print(f"{url}无效,报错的key:", e)
            return
        if not title:
            title, = re.findall("<title[^>]+>\s*([^>]+)\s*</title>", res.text)
        video_url = urljoin(url, detail['video']['playApi'])
        collection_urls = set(re.findall("//www.douyin.com/collection/\d+/\d+", res.text))
        collection_urls = [urljoin("https://www.douyin.com", url) for url in collection_urls]
        collection_urls.sort(key=lambda s: int(s[s.rfind("/") + 1:]))

        collection_title = re.findall("<h2 [^>]+>([^<>]+)</h2>", res.text)[0]
        return video_url, title, collection_urls, collection_title
    else:
        print('视频链接请求失败!!!')

视频下载的核心代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def download_video(video_url, title, folder):
    start_time = time.time()
    res = requests.get(url=video_url, stream=True)
    done_size, total = 0, int(res.headers['content-length'])
    chunk_size = 1024 * 1024
    title = format_filename(title)
    file_size = round(int(res.headers['content-length']) / 1024 / 1024, 2)
    basename = f"{title}.mp4"
    filename = f"{folder}/{title}.mp4"
    if os.path.exists(filename):
        print(basename, "已存在,跳过...")
        return
    print("-----------------------------------")
    print(f'开始下载文件:{basename}\n当前文件大小:{file_size}MB')
    with open(filename, 'wb') as f:
        for chunk in res.iter_content(chunk_size):
            f.write(chunk)
            done_size += len(chunk)
            cost_time = time.time() - start_time
            yield done_size, cost_time, total
            # print(f"进度:{done_size / total:.2%},{done_size / cost_time / 1024 / 1024:.2f}MB/s")
    cost_time = time.time() - start_time
    print(f'文件:{basename} 下载完成!\n耗时:{cost_time:0.2f} 秒')

关于视频链接的分析,大家可以参考才哥的文章: 《用Python搞定抖X无水印短视频下载》 链接:https://mp.weixin.qq.com/s/NNVT6IH6dpT0rTeu1-oD6w

UI界面设计核心代码如下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
layout = [
    [sg.Text('抖音视频地址:', font=("楷体", 12)),
     sg.In(key='url', size=(70, 1), text_color="#bb8b59",
           default_text="https://www.douyin.com/video/6803929443069988103")],
    [sg.Checkbox('如果是一个合集则下载整个合集', key="download_collection", default=False),
     sg.Button('开始下载'),
     sg.Button('清空输出'),
     sg.Button('访问抖音主页'),
     sg.Button('访问当前地址'),
     ],
    [sg.Output(size=(85, 10), key="out", text_color="#15d36a")],
    [
        sg.ProgressBar(1000, size=(20, 20), key='video_bar', bar_color=("#bb8b59", "#295273")),
        sg.Text('000.0MB,00/00\n00:00<00:00', key="message_video"),
        sg.ProgressBar(1000, size=(20, 20), key='progressbar', bar_color=("#15d36a", "#295273")),
        sg.Text('00.00MB/00.00MB\n00.00MB/s', key="message")
    ],
    [sg.Text('输出目录:', font=("楷体", 12)),
     sg.In(size=(35, 1), key="save_dir"),
     sg.FolderBrowse('...', target='save_dir', initial_folder="."),
     sg.Checkbox(' 下载完毕后 \n打开所在目录', key="open_folder", default=True),
     sg.Button('打开输出目录'),
     ],
    [sg.Text("@小小明:https://blog.csdn.net/as604049322"), ],
]

程序下载

该工具的完整代码和已打包的工具下载地址:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
https://gitcode.net/as604049322/python_gui/-/tree/master/douyin

小伙伴们,快快用实践一下吧!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Django 1.10中文文档-第一个应用Part3-视图和模板
目录[-] 本教程上接Django 1.10中文文档-第一个应用Part2-模型和管理站点。我们将继续开发网页投票这个应用,主要讲如何创建一个对用户开放的界面。 概览 视图是Django应用中的一“类”网页,它通常使用一个特定的函数提供服务,并且具有一个特定的模板。例如,在博客应用中,可能有以下视图: 博客首页 —— 显示最新发表的博客; 博客“详细”页面 —— 每博客的链接页面; 基于年份的归档页面 —— 显示特定年内所有月份发表过的博客; 基于月份的归档页面 —— 显示特定月份内
jhao104
2018/03/20
2.5K0
Django快速入门——投票程序(3)视图
原教程说的比较抽象,这里简单认为视图就是views.py中的函数,用于处理数据并渲染网页。我们的投票应用中,需要下列几个视图:
一只大鸽子
2023/09/02
3120
Django快速入门——投票程序(3)视图
Django 学习笔记 1.3 视图和模板
前一节是后端的内容,这一节则是前端的内容,我们将继续编写投票应用,并且专注于如何创建公用界面——也被称为“视图”。
twowinter
2020/04/17
1.3K0
Django Response对象3.4
HttpResponse对象 在django.http模块中定义了HttpResponse对象的API HttpRequest对象由Django自动创建,HttpResponse对象由程序员创建 不调用模板,直接返回数据 #coding=utf-8 from django.http import HttpResponse def index(request): return HttpResponse('你好') 调用模板 from django.http import HttpResponse f
Lansonli
2021/10/09
9110
Django -- 视图是啥?模板是何物?
在Django的官方文档中是这么定义视图的: "一类具有相同功能和模板的网页的集合",概念比较抽象,我们直接 拿比较简单常见论坛网站来举例,可能要求创建以下视图:
周辰晨
2020/01/20
1.1K0
Django -- 视图是啥?模板是何物?
django 1.8 官方文档翻译: 1-2-3 编写你的第一个Django应用,第3部分
本教程上接 教程 第2部分 。我们将继续 开发 Web-poll 应用并且专注在创建公共界面 – “视图 (views )”。
ApacheCN_飞龙
2022/11/27
2K0
Django来敲门~第一部分【6.2 HTML视图模板】
天下难事必作於易。天下大事必作於细。是以圣人终不为大,故能成其大 ——老子《道德经》
大牧莫邪
2018/08/27
1K0
Django—入门
举个简单的例子,对于一个公司来说,公司中有各个职能部门,每个部门各司其职,通过部门之间的配合来完成工作,这些部门就形成了一个公司的组织架构。从某种意义上来说,公司就是一种框架。那么对应到软件设计上来说,软件框架是由其中的各个模块组成的,每个模块负责特定的功能,模块与模块之间相互协作来完成软件开发。
py3study
2020/01/16
1.9K0
Django—入门
Python-Django 第一个Django app
下载地址:https://www.python.org/downloads/release/python-340/
授客
2019/09/11
1.3K0
Python-Django 第一个Django app
First Django App!
  上篇笔记从零创建了一个django项目,一个项目肯定是由多个模块组成的,比方说一个电商项目,包括支付模块,商品展示模块,商家用户聊天模块等等,这些模块便可称之为一个应用。
小孙同学
2022/01/17
2.2K0
First Django App!
django2.0入门教程第三节
继上篇django2.0入门教程第二节,介绍了对django2.0模型类models的操作,本篇主要讲视图views和模板template django的视图用于处理url请求,并将响应的数据传递到模板,最终浏览器将模板数据进行渲染显示,用户就得到了想要的结果 作为一个简易的投票系统, 除了index(主页), 还需要detail(详情页), results(结果页), vote(投票页) 这些视图。 增加视图:polls/views.py #_*_coding:utf8_*_ from django.sh
章鱼喵
2018/06/21
6900
Django学习笔记 1.4 表单和通用视图
更新一下在上一个教程中编写的投票详细页面的模板 (“polls/detail.html”) ,增加一个 HTML 元素:
twowinter
2020/04/17
8350
七日Python之路--第三天(之初试Django 2-2)
接上文。前面(1)(2)部分已经实现浏览器访问工程项目,并且能后台管理新创建的app。
lpe234
2020/07/27
3790
Django 1.10中文文档-第一个应用Part4-表单和通用视图
目录[-] 本教程接Part3开始。继续网页投票应用程序,并将重点介绍简单的表单处理和精简代码。 一个简单表单 更新一下在上一个教程中编写的投票详细页面的模板polls/detail.html,让它包含一个HTML<form> 元素: # polls/templates/polls/detail.html <h1>{{ question.question_text }}</h1> {% if error_message %}<p><strong>{{ error_message }}</stron
jhao104
2018/03/20
2.5K0
二、路由、模板
一、路由系统 在settings.py文件中通过ROOT_URLCONF指定根级url的配置 urlpatterns是一个url()实例的列表 一个url()对象包括: 正则表达式 视图函数 名称name 编写URLconf的注意: 若要从url中捕获一个值,需要在它周围设置一对圆括号 不需要添加一个前导的反斜杠,如应该写作'test/',而不应该写作'/test/' 每个正则表达式前面的r表示字符串不转义 请求的url被看做是一个普通的python字符串,进行匹配时不包括get或post请求的参数及域
酱紫安
2018/04/16
1.9K0
Django—视图
视图负责接受Web请求HttpRequest,进行逻辑处理,返回Web响应HttpResponse给请求者。
py3study
2020/01/16
4.5K0
Django—视图
Django 视图URLconf3.1
URLconf 在settings.py文件中通过ROOT_URLCONF指定根级url的配置 urlpatterns是一个url()实例的列表 一个url()对象包括: 正则表达式 视图函数 名称name 编写URLconf的注意: 若要从url中捕获一个值,需要在它周围设置一对圆括号 不需要添加一个前导的反斜杠,如应该写作'test/',而不应该写作'/test/' 每个正则表达式前面的r表示字符串不转义 请求的url被看做是一个普通的python字符串,进行匹配时不包括get或post
Lansonli
2021/10/09
4730
Django - - - -视图层之视图函数(views)
视图层之视图函数(views) 一个视图函数,简称视图,是一个简单的Python 函数,它接受Web请求并且返回Web响应。响应可以是一张网页的HTML内容,一个重定向,一个404错误,一个XML文档,或者一张图片. . . 是任何东西都可以。无论视图本身包含什么逻辑,都要返回响应。代码写在哪里也无所谓,只要它在你的Python目录下面。除此之外没有更多的要求了——可以说“没有什么神奇的地方”。为了将代码放在某处,约定是将视图放置在项目或应用程序目录中的名为views.py的文件中。 视图函数:     一
用户1214487
2018/01/24
1.6K0
Django - - - -视图层之视图函数(views)
Django学习模板(7)
前面学了视图,我们可以在访问 localhost:8000/polls/ 看到我们返回的内容。
萌海无涯
2019/09/03
4500
Django学习模板(7)
Django知识点
一、Django pip3 install django C:\Python35\Scripts # 创建Django工程 django-admin startproject 【工程名称】 mysite - mysite # 对整个程序进行配置 - init - settings # 配置文件
院长技术
2021/02/19
8600
相关推荐
Django 1.10中文文档-第一个应用Part3-视图和模板
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验