不论是发布文章还是视频,都会面临着一个多平台发布的问题,如果能够一次性同时发布多个平台就好了。如果我在A平台发布了一个视频,如果这时候有一个工具可以帮我下载这个视频,并去掉水印发布自动发布到B平台上,简直就太完美了。
因为之前发的视频都在抖音上,现在想把自己的这些视频发布到微信视频号上。但是我发现抖音上的视频我居然下载不下来,然后就算下载之后还会有水印。所以奇思妙想了一下,能不能写个程序自己下载去水印的一个程序。
加上最近浏览了腾讯云社区的mcp广场,看到了很多有趣的MCP Server。
所以也能有了写一个自动去抖音视频水印的MCP Server的想法,所以本篇文章,会从一个普通python程序开始,从零带你入门开发MCP Server。
这是我在抖音上找到一个视频复制的分享链接。
3.51 复制打开抖音,看看【叫我阿柒啊的作品】程序员零门槛副业# 程序员 # 日常vlog # ... https://v.douyin.com/nWzAJk8H0-E/ S@l.CU 06/27 GVY:/
我们使用正则从中提取https链接部分。
def getShareLink(self, string):
return re.findall('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', string)[0]
复制到浏览器可以看到这就是一个抖音视频播放页,但是地址栏中的 url 由 https://v.douyin.com/nWzAJk8H0-E 跳转到了 https://www.douyin.com/video/7480659754788900122,这时候我大概明白了,重定向了。
我们使用重定向后的分享链接,在python中继续发起请求,这里就涉及一个python请求模块的选择问题,如果使用httpx模块请求,则需要从响应头(response header)的Location中提取重定向请求,如果使用requests模块,则默认重定向,我们直接从reponse.url中获取就可以了。我选择了requests模块,调试如下:
我们接着对重定向url发起请求,在返回的网页内容中找到了一个 wondow._ROUTER_DATA 的json文本,里面包含了视频信息。
我们使用正则提取信息,json 模块格式化文本数据。
pattern = re.compile(
pattern=r"window\._ROUTER_DATA\s*=\s*(.*?)</script>",
flags=re.DOTALL)
find_res = pattern.search(response.text)
json_data = json.loads(find_res.group(1).strip())
数据如下:
继续抽丝剥茧,通过一层层的信息,在 videoInfoRes 的 item_list 下,可以获取到视频很多信息。
其中,在 play_addr 下面我们可以获取到一个播放链接。
直接用这个链接访问,播放的是一个有水印的视频。
在url中,我们可以看到有一个 playwm 单词,其中wm是 watermark(水印)的缩写,去掉wm后就能得到一个无水印链接了。我们将播放链接在浏览器中访问,就可以播放无水印视频。
点击右键选择视频另存为即可。在这里,我们可以开发程序,将视频下载下来保存到本地。
在视频下载的时候,我们将上面的url粘贴进浏览器之后,你会发现其实他还是会进行一个302重定向。
所以,真正的播放页面还是在 response headers 的 Location 中。
这里我使用requests实现下载,上面也讲过了,requests会自动重定向,所以这个302重定向的页面我们无需自行处理。
在上面代码中,我们使用 tqdm 模块实现一个进度条,效果如下:
在我们的目录下,就有了下载好的视频。
我们在开发完 python 程序之后,我们只要将视频分享文本传入程序并启动,就可以实现无水印的抖音视频下载。但是我现在想要使用AI大模型,通过一句话自动调用我的这个工具,实现无水印视频下载。所以这里就需要将程序改造成 mcp server。
在 mcp sdk 的加持下,将现有程序改造成mcp很简单。只需要三步:
为了简化mcp server的代码量和可读性,我在 mcp server 中去掉了下载视频的代码,因为我发现在大模型中是支持命令行的,使用 curl 或者 wget 下载比调用tool更方便。所以在mcp中只需要解析无水印链接就可以了。去水印mcp server程序如下:
import json
import re
import requests
from tqdm import tqdm
from mcp.server.fastmcp import FastMCP
headers = {
'User-Agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 17_2 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) EdgiOS/121.0.2277.107 Version/17.0 Mobile/15E148 Safari/604.1'
}
mcp = FastMCP("DyNoWatermark")
@mcp.tool()
def parse_share_url(share_text: str):
share_url = re.findall('http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', share_text)[0]
share_response = requests.get(share_url, headers=headers)
video_id = share_response.url.split("?")[0].strip("/").split("/")[-1]
share_url = f'https://www.iesdouyin.com/share/video/{video_id}'
response = requests.get(share_url, headers=headers)
response.raise_for_status()
pattern = re.compile(
pattern=r"window\._ROUTER_DATA\s*=\s*(.*?)</script>",
flags=re.DOTALL,
)
find_res = pattern.search(response.text)
if not find_res or not find_res.group(1):
raise ValueError("parse video json info from html fail")
json_data = json.loads(find_res.group(1).strip())
VIDEO_ID_PAGE_KEY = "video_(id)/page"
NOTE_ID_PAGE_KEY = "note_(id)/page"
if 'video_(id)/page' in json_data["loaderData"]:
original_video_info = json_data["loaderData"][VIDEO_ID_PAGE_KEY]["videoInfoRes"]
elif NOTE_ID_PAGE_KEY in json_data["loaderData"]:
original_video_info = json_data["loaderData"][NOTE_ID_PAGE_KEY]["videoInfoRes"]
else:
raise Exception("failed to parse Videos or Photo Gallery info from json")
data = original_video_info["item_list"][0]
# 获取视频播放地址
video_url = data["video"]["play_addr"]["url_list"][0].replace("playwm", "play")
return video_url
if __name__ == "__main__":
print("Starting MCP server...")
mcp.run()
在去水印的 mcp server 中,我们只定义了一个名为 parse_share_url 的 tools。
接着我们在 codebuddy 测试 mcp server,点击配置 mcp server 然后进入到 Craft_mcp_settings.json 编辑页面。
将下面 mcp server 的json信息配置进去:
{
"mcpServers": {
"dyqsy": {
"command": "python3.10",
"args": [
"/Users/guanshilong/app/idea/WorkSpace/PythonDemo/test/qsy.py"
]
}
}
}
args 中的路径修改成你自己的路径。然后我们将从抖音分享链接输入对话框中,大模型会调用 parse_share_url 这个工具,解析出无水印视频播放源。
然后会自动使用 wget 或者 curl对视频进行下载。
在下载完成之后,大模型会验证视频是否已经下载到了指定的目录文件。
通过自定义 mcp server,实现了我个人抖音无水印视频的下载。同时在本文中也可以看到,将一个 python 程序改造成大模型可以识别的 mcp server,是一件非常容易的事情。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。