前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果pli

【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果pli

原创
作者头像
卓伊凡
发布2025-02-14 11:33:22
发布2025-02-14 11:33:22
5100
代码可运行
举报
运行总次数:0
代码可运行

【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡

开发背景

由于客户另外一些小需求转了500元,因此我赠送一个落地页,要求不是很高,可能后面还会转账一些来解决安卓苹果下载的问题,既然客户没有对界面特殊要求我就自由发挥了,先说好客户产品是五证齐全的正规麻将娱乐产品,不要想歪了,公安备案都是委托卓伊凡去帮忙提交的资料,你们也可以下载试玩,但是我根本看不懂,卓伊凡虽然是四川人但是根本不会打麻将,从小爹妈不让学,对了,本文是python爬虫有关,请合理合法使用,注意法律问题。

实战开发

找个目标站

先问豆包要了一下最近比较火的落地页,

找我豆包的智能体,软件源码大全(卓伊凡)要网址,这一下给我来一堆太大的。

这回不错

时光序挺好看的,不过再看几个,

再次让给到发现这个酷我的下载页面很不错,稍微改一下是可用的

接下来正式开始,

用python爬取一下前端页面

思路如下

详细说明:

  1. 安装库: 使用 pip 安装 requestsBeautifulSoup 库。
  2. 发送请求:
    • 设置请求头以模拟浏览器请求。
    • 使用 requests.get 发送 GET 请求并检查响应状态码。
  3. 保存 HTML 文件:
    • 创建保存目录 kuwo_down
    • 将 HTML 内容保存到 index.html 文件中。
  4. 解析网页内容:
    • 使用 BeautifulSoup 解析 HTML 内容。
  5. 下载并保存 CSS 文件:
    • 查找所有 CSS 文件链接,使用 urljoin 构建完整的 URL。
    • 发送请求并保存 CSS 文件到指定目录。
  6. 下载并保存 JS 文件:
    • 查找所有 JS 文件链接,使用 urljoin 构建完整的 URL。
    • 发送请求并保存 JS 文件到指定目录。

新建download.py文件

安装依赖库

pip install requests beautifulsoup4

卓伊凡发现自己已经安装,只是提示升级

代码语言:javascript
代码运行次数:0
运行
复制
import os

import requests

from bs4 import BeautifulSoup

from urllib.parse import urljoin, urlparse



\# 目标URL

url \= 'https://www.kuwo.cn/down'



\# 设置请求头,模拟浏览器请求

headers \= {

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36'

}



\# 发送GET请求

response \= requests.get(url, headers\=headers)

response.raise\_for\_status()  \# 检查请求是否成功



\# 创建保存目录

os.makedirs('kuwo\_down/css', exist\_ok\=True)

os.makedirs('kuwo\_down/js', exist\_ok\=True)

os.makedirs('kuwo\_down/assets', exist\_ok\=True)



\# 保存HTML文件

html\_file\_path \= os.path.join('kuwo\_down', 'index.html')

with open(html\_file\_path, 'w', encoding\='utf-8') as file:

    file.write(response.text)



\# 解析网页内容

soup \= BeautifulSoup(response.content, 'html.parser')



\# 下载并保存CSS文件

css\_links \= soup.find\_all('link', rel\='stylesheet')

for link in css\_links:

    css\_url \= urljoin(url, link\['href'\])

    css\_response \= requests.get(css\_url)

    css\_response.raise\_for\_status()

    css\_file\_name \= os.path.basename(urlparse(css\_url).path)

    css\_file\_path \= os.path.join('kuwo\_down/css', css\_file\_name)

    with open(css\_file\_path, 'w', encoding\='utf-8') as file:

        file.write(css\_response.text)



\# 下载并保存JS文件

js\_links \= soup.find\_all('script', src\=True)

for script in js\_links:

    js\_url \= urljoin(url, script\['src'\])

    js\_response \= requests.get(js\_url)

    js\_response.raise\_for\_status()

    js\_file\_name \= os.path.basename(urlparse(js\_url).path)

    js\_file\_path \= os.path.join('kuwo\_down/js', js\_file\_name)

    with open(js\_file\_path, 'w', encoding\='utf-8') as file:

        file.write(js\_response.text)



\# 下载并保存图片等静态文件

static\_links \= soup.find\_all(\['img', 'link', 'script'\], src\=True)

for static in static\_links:

    static\_url \= urljoin(url, static\['src'\])

    static\_response \= requests.get(static\_url)

    static\_response.raise\_for\_status()

    static\_file\_name \= os.path.basename(urlparse(static\_url).path)

    static\_file\_extension \= os.path.splitext(static\_file\_name)\[1\].lower()

    if static\_file\_extension in \['.png', '.jpg', '.jpeg', '.gif', '.svg'\]:

        static\_file\_path \= os.path.join('kuwo\_down/assets', static\_file\_name)

    else:

        continue  \# 跳过非静态资源文件

    with open(static\_file\_path, 'wb') as file:

        file.write(static\_response.content)



print("网页内容下载完成!")

对应编写的python爬取代码,

执行后成功下载网页,但是我们发现有问题

资源方面都是成功下载了,包括css 和js,以及静态图片,但是首页代码奇乱,我怀疑这页面是vue写的,本地运行后显示也不对

赶紧查看下,果然是vue写的,所以vue是有好处的,编译后的文件让别人要仿你是很难的,我们需要换个目标站,这次卓伊凡会先检查下是否是vue。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 【01】仿站技术之python技术,看完学会再也不用去购买收费工具了-用python扒一个app下载落地页-包括安卓android下载(简单)-ios苹果plist下载(稍微麻烦一丢丢)-客户的麻将软件需要下载落地页并且要做搜索引擎推广-本文用python语言快速开发爬取落地页下载-优雅草卓伊凡
  • 开发背景
  • 实战开发
    • 找个目标站
    • 用python爬取一下前端页面
      • 详细说明:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档