首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

某动态js加密cookie网站爬虫记录

虽然可以爬取的平台很多,可以选择爬取其他平台的数据来代替,但是考虑到该平台的可用数据量很大,值得花时间做这个爬虫,同时也是受到好奇心的驱使,于是研究了该平台的反爬机制。以下将该站点称为h网站。...2.问题描述:h网站的的访问需要带上一个动态cookie才能访问成功。...爬虫的难度 相比其他网站,该网站爬虫的难度在于每次访问需要带上所需的动态cookie,但是脱离了浏览器环境,产生cookiejs代码无法执行,而且js代码也是动态变化的,所以无法只在js环境里面执行一次代码...简而言之,除了没有图形界面,headless chrome具有所有现代浏览器的特性,可以像在其他现代浏览器里一样渲染目标网页,并能进行网页截图,获取cookie获取html等操作。...利用chromedp访问后已经无需再执行动态js,访问的时候代码已经执行过了,此时cookie已经产生。所以只需要利用chromedp获取headless chrome里存储的cookie即可。

4.1K00
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    JS操作cookie

    一、 Cookie 本篇文章主要讲述对cookie的操作,如 设置、读取、检查、删除 。 首先了解下cookie的基本知识: 关于cookie Cookie,有时也用其复数形式 Cookies。...类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。...新建cookie.js 一般情况下,为了在项目里能友好的使用一个功能,那么就会将其封装,然后模块导出使用。此时,我们可以在目录下新建文件夹util,在util中将各种封装的工具类放入。...此时我们可以在 util 下新建 cookie.js 文件。 2. 设置cookie 这类使用场景较多,例如登录或将部分信息存储到cookie等场景都会用到。...引入挂载 在 main.js 中操作: // ... import Vue from 'vue' // 引入 import { setCookie, getCookie, checkCookie, clearCookie

    9.8K30

    JS 逆向百例】某网站加速乐 Cookie 混淆逆向详解

    逆向目标 目标:加速乐加密逆向 网站:aHR0cHM6Ly93d3cubXBzLmdvdi5jbi9pbmRleC5odG1s 逆向难点:OB 混淆、动态加密算法、多层 Cookie 获取 加速乐 加速乐是知道创宇推出的一款网站...逆向思路 根据我们上面讲的加速乐的特点,我们想要获取到真实的 HTML 页面,需要经过以下三个步骤: 第一次请求网站,服务器返回的 Set-Cookie 中携带 jsluid_s 参数,将获取到的响应内容解密拿到第一次...jsl_clearance_s 参数的值; 携带第一次请求网站获取到的 Cookie 值再次访问网站,将获取到的响应内容解混淆逆向拿到第二次 jsl_clearance_s 参数的值; 使用携带 jsluid_s...和 jsl_clearance_s 参数的 Cookie 再次访问网站获取到真实的 HTML 页面内容,继而采集数据。...Hook Cookie 值 因为我们获取到的 JS 文件生成了 Cookie,其中包含 jsluid_s 和 jsl_clearance_s 参数的值,所以我们不妨直接 Hook Cookie 也能断到

    1.4K70

    js_cookie 破解

    首先,这一串看着就不舒服,我们先把它格式化了再看,介绍一个 js 代码美化网站 “https://beautifier.io/”,当然还有很多网站可以美化 js 代码,自行百度即可。...cookie 值的 js 代码,然后需要携带上这串 js 去请求网站就能成功返回信息了。...、js2py,推荐使用 PyExecJS)运行这几段 js 代码得到我们所需 cookie 就可以携带者 cookie 去登陆网站了,那么我们开始实现 Python 代码吧!...返回结果我们也知道就是一段 js 代码,然后我们需要处理这段 js 代码,用 python 语句实现我们之前做的,目标是得到 cookie 的值。...好的,到这里就基本完成了 js_cookie 的破解了,你也可以毫无问题的请求这个网站不会再遇到 521 问题了,是不是解决了,最后提醒一下,因为他返回的 js 计算出来的 cookie 值那个 cookie

    9.4K20

    JS-Cookie操作

    类型为“小型文本文件”,是某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息。...新建cookie.js 一般情况下,为了在项目里能友好的使用一个功能,那么就会将其封装,然后模块导出使用。此时,我们可以在目录下新建文件夹util,在util中将各种封装的工具类放入。...此时我们可以在 util 下新建 cookie.js 文件。 2. 设置cookie 这类使用场景较多,例如登录或将部分信息存储到cookie等场景都会用到。...总结下: 新建 cookie.js 文件 写几个操作 cookie 方法,模块打出 全局引入(main.js 挂载到 Vue)上,或者在组件中局部引入 在合适的场景下合理调用即可。...往期推荐 关键词高亮显示 JavaScript垃圾收集 JS事件流

    6.6K10

    【Spring】获取 Cookie和Session

    例如登录网站成功后,第二次访问的时候服务器就能知道该请求是否是已经登录过了 上述图片中的“令牌”通常就存储在 Cookie 字段中 比如去医院挂号: 看病之前先挂号,挂号时需要提供身份证号,...此时患者的身份和就诊卡的关联关系就被销毁了(类似于网站的注销功能) 又来看病,可以办一张新的就诊卡,此时就得到了一个新的“令牌” 此时在服务器这边就需要记录“令牌”的信息,以及令牌对应的用户信息,这个就是...但是站在整个登录流程中看待,也可以把这个唯一性字符串称为“token” 上述例子中的令牌 ID,就可以看做是 SessionId,只不过令牌除了 ID 之外,还会带一些其他信息,比如时间、签名等 token...信息中获取到对应的用户信息,再进行后续操作。...Cookie 和 Session 经常会在一起配合使用,但不是必须配合 完全可以用 Cookie 来保存一些数据在客户端。

    9810

    解决document.cookie无法获取cookie问题

    一、前言 在进行前后端联调的时候,由于想实现一个登出操作,前端自动删除浏览器存储的cookie,想通过document.cookie获取进而进行删除操作,但是发现浏览器有cookie;但是无法获取到情况遂记录...二、场景复现 首先登录后,浏览器中是有记录cookie的,如图 然后我代码层执行documen.cookie发现获取不到,浏览器控制台也同样 后面去研究了一下application中存放的...cookie = new Cookie(name, URLEncoder.encode(value, "utf-8")); cookie.setPath("/"); cookie.setDomain...(domain); cookie.setMaxAge(maxAge); cookie.setHttpOnly(true); //后端设置httpOnly属性为true...(var6.getMessage()); } } 后面我将HttpOnly设置false状态后,documen.cookie就能够获取到 百度查了一下HttoOnly属性的作用,觉得这个博主解释很到位

    4.6K20

    使用node.js抓取其他网站数据,以及cheerio的介绍

    一、基本思路   首先寻找一个网址:http://tech.ifeng.com/,因为这个是http协议,所以我们需要用到node.js的HTTP模块,我们使用HTTP模块中的get()方法进行抓取。...其中假如我们不需要抓取的所有数据,而我们只需要其中的部分数据,比如某个类下面的a标签里的文字,这时如果是在前端中我们可以用DOM操作找到这个节点,但是node.js中没有DOM操作,所以这里我们需要用到...既然抓取了网站上的数据就会涉及到文件的写入,这时需要用到node.js中的fs模块。...二、学习网址 https://cheerio.js.org/ cheerio官方学习文档 https://www.npmjs.com/package/cheerio cheerio npm网址 https...://nodejs.org/dist/latest-v10.x/docs/api/ node.js官方文档 http://nodejs.cn/api/ node.js中文文档 二、什么是cheerio

    2.3K21
    领券