短信接收服务

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

我们在网站运营的时候，最大的问题就是：我们自己花费几个小时甚至是几天辛辛苦苦创作作的内容，被爬虫只需要 1s 就抓去了。为了保卫我们创作的成果，也为了网站的稳定运行，我们需要对爬虫说：No，我们在反爬虫的过程中最重要的就是如何识别爬虫。

反爬虫的重点：识别爬虫

网络爬虫是一种在 Internet 上运行自动化任务的软件应用程序。与人类互联网活动相比，网络爬虫运行的任务通常很简单，并且执行速度要快得多。

什么是网络爬虫？

经常有小伙伴需要将互联网上的数据保存的本地，而又不想自己一篇一篇的复制，我们第一个想到的就是爬虫，爬虫可以说是组成了我们精彩的互联网世界。

爬虫数据采集

上一期我们讲解了数据标准化相关内容，首先对单词出现的频率进行排序，之后对一些大小写进行转换，缩小 2-gram 序列的重复内容。

爬虫系列：穿越网页表单与登录窗口进行采集

上一期我们介绍了使用 Python 数据清洗的相关方法，本篇文章我们介绍数据标准化的相关方法。

爬虫系列：数据标准化

上一期我们讲解了使用 Python 读取 CSV、PDF、Word 文档相关内容。

爬虫系列：数据清洗

上一期我们讲解了使用 Python 读取文档编码的相关问题，本期我们讲解使用 Python 处理 CSV、PDF、Word 文档相关内容。

爬虫系列：读取 CSV、PDF、Word 文档

上一篇文章我们介绍了如何通过 MySQL 存储 Python 爬虫采集的内容，以及使用Python 与 MySQL 交互，这篇文章我们介绍如何通过 Python 读取文档。

爬虫系列：读取文档

上一篇文章我们讲解了爬虫如何存储 CSV 文件，这篇文章，我们讲解如何将采集到的数据保存到 MySQL 数据库中。

爬虫系列：使用 MySQL 存储数据

上一期：爬虫系列：存储媒体文件，讲解了如果通过爬虫下载媒体文件，以及下载媒体文件相关代码讲解。

爬虫系列：存储 CSV 文件

如果你查看服务器日志，看到密密麻麻的 IP 地址，你一眼可以看出来那些 IP 是爬虫，那些 IP 是正常的爬虫，就像这样：

如果通过 IP 判断是否是爬虫

本期爬虫系列主要讲解爬虫采集完成数据之后，我们应该怎么存储，以及用什么样的方式存储数据。

爬虫系列：存储媒体文件

应用编程接口（Application Programming Interface, API）的用处：它为不同的应用提供了方便友好的接口。不同的开发者用不同的架构，甚至是不同的语言编写软件都没有问题——因为 API 设计的目的就是要成为一种通信语言，让不同的软件进行信息共享。

爬虫系列：使用 API

上一期只是一个简单的例子，获取了网站的一小部分内容，本期开始讲解需要获取网站的所有文章列表。

爬虫系列：数据采集

这篇文章是爬虫系列第三期，讲解使用 Python 连接到网站，并使用 BeautifulSoup 解析 HTML 页面。

爬虫系列：连接网站与解析 HTML

使用网络爬虫做数据采集也应该有所不为。国内外关于网络数据保护的法律法规都在不断的制定与完善中，这篇文章主要从道德风险和法律责任两方面来分析爬虫做数据采集所带来的问题。

爬虫系列：爬虫所带来的道德风险与法律责任

如果有大量的百度蜘蛛抓取网站就需要注意了：有可能是其他爬虫伪造百度蜘蛛恶意抓取网站。

如何通过 User-Agent 识别百度蜘蛛

在大数据深入人心的时代，网络数据采集作为网络、数据库与机器学习等领域的交汇点，爬虫技术已经成为满足个性化网络数据需求的最佳实践。

爬虫系列：爬虫介绍

现在在国内各大网站注册用户名都需要输入电话号码，有些网站比较好，不会给你打骚扰电话，但是有些网站你自从输入了电话号码之后，你的手机就会接到各种各样的推销电话。

如何不通过自己手机注册网站

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了短信接收服务专栏，为你提供了短信接收服务的相关文章，致力于帮助开发者快速成长与发展。

短信接收服务

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐