首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    反击“猫眼电影”网站的反爬虫策略

    0x01 前言 前两天在百家号上看到一篇名为《反击爬虫,前端工程师的脑洞可以有多大?》的文章,文章从多方面结合实际情况列举了包括猫眼电影、美团、去哪儿等大型电商网站的反爬虫机制。的确,如文章所说,对于一张网页,我们往往希望它是结构良好,内容清晰的,这样搜索引擎才能准确地认知它;而反过来,又有一些情景,我们不希望内容能被轻易获取,比方说电商网站的交易额,高等学校网站的题目等。因为这些内容,往往是一个产品的生命线,必须做到有效地保护。这就是爬虫与反爬虫这一话题的由来。本文就以做的较好的“猫眼电影”网站为例,搞定

    05

    CCS 2018论文解读:使用少量样本破解文本验证码

    相信大家在日常上网的时候都会遇到“千奇百怪”的验证码,而在种类繁多的验证码家族中,文本验证码是使用最广泛的一种,也是我们遇到最多的一种验证码方案。近年来,随着深度学习技术的突破性发展,文本验证码的安全性也受到了挑战。通过收集大量目标网站的验证码,并训练一个深度网络模型,就可以实现对目标网站验证码的攻击。为了抵抗基于深度学习模型的攻击,一方面,各大网站都采用诸如字符扭曲、粘连、旋转,背景混淆,空心字体等多种复杂变换方案来提高文本验证码的安全性;另一方面,有些网站采用了诸如前端代码混淆、关键代码加密等反分析方式来防止验证码被恶意收集和自动爬取,进而通过增大攻击的成本来降低验证码被攻击的可能性。然而,上述两种方式真的能够增强验证码的安全性吗?

    02
    领券