首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    js爬虫,正则

    大概看了下,是js加载的,而且数据在js函数中,很有意思,就分享出来给大家一起看看! 抓取目标 ?...今天我们的目标是上图红框部分,首先我们确定这部分内容不在网页源代码中,属于js加载的部分,点击翻页后也没有json数据传输! ?...但是发现有个js的请求,点击请求,是一行js函数代码,我们将其复制到json的视图查看器中,然后格式化一下,看看结果 ? ?...只是其内容,需要在进行处理一下,我们写到代码中看看 开始写代码 先导入库,因为最终需要从字符串中截取部分,所以用requests库获取请求,正则re匹配内容即可。然后我们先匹配出上述3项 ?...这样,就取出了本页的所有新闻和URL的相关内容,在外层加上循环,即可抓取所有的新闻页,任务完成!

    7.6K20

    js正则小结

    1,\ 斜杠用于转义,在js正则里,只有一些元字符(*,?,.等)和\本身需要转义,其他的不需要转义,如果其他的字符前面使用了\,可能会产生负面影响,比如\b,\t这些有特殊含义的转义。...此外,在js正则中,\还有一个用处在于使用new RegExp()形式创建正则对象时,比如new RegExp('a\*a'),其中*是乘以的意思,js引擎在解析该正则表达式字符串时,会消耗掉这个斜杠,...2 ^ 该元字符比较简单,就是表示该正则是从字符串的首字符开始匹配的,有一个地方需要注意的是,如果该正则表达式加了m标记时,匹配到了行分隔符的时候就会结束。然后会在下一行继续匹配。...$n ()代表捕获分组,x代表的表达式所匹配的内容可以在x所有的正则中或者其他地方使用。...$&是一个特殊的变量,他代表是整个正则表达式匹配到的结果。也就是xy。 7 (?:x) 非捕获分组,也就是()中的表达式捕获到分组不可在其他地方使用。'x'.replace(/(?

    7.6K50

    js事件循环

    首先,我们来解释下事件循环是个什么东西: 就我们所知,浏览器的js是单线程的,也就是说,在同一时刻,最多也只有一个代码段在执行,可是浏览器又能很好的处理异步请求,那么到底是为什么呢?...我们先来看一张图(这张图来自于http://www.zcfy.cc/article/node-js-at-scale-understanding-the-node-js-event-loop-risingstack...从上图我们可以看出,js主线程它是有一个执行栈的,所有的js代码都会在执行栈里运行。...原因:因为一开始js主线程中跑的任务就是macrotask任务,而根据事件循环的流程,一次事件循环只会执行一个macrotask任务,因此,执行完主线程的代码后,它就去从microtask队列里取队首任务来执行..., 以及借鉴了其他优秀文章 参考: http://www.zcfy.cc/article/node-js-at-scale-understanding-the-node-js-event-loop-risingstack

    18.8K41

    JS 循环链表

    循环链表的概念循环链表是一种链表的变体,其中链表中的最后一个节点指向链表的头节点,形成一个循环或环状结构。与普通链表不同,循环链表没有明确的结束点。...循环链表具有以下几个特点:循环性:循环链表是通过将最后一个节点指向头节点来形成循环的闭合结构。这意味着链表中没有明确的结束点,可以从任何节点开始遍历整个链表,直到回到原始出发节点。...灵活性:由于循环链表是循环的,因此可以在任意位置插入或删除节点,而无需修改其他节点的指针。这使得循环链表在某些场景下更加灵活和高效,例如实现循环列表、轮播图等。...场景应用:循环链表常用于需要循环遍历的场景。例如,在游戏开发中,可以使用循环链表来实现循环列表,遍历玩家角色队列;在轮播图或循环播放的场景中,可以使用循环链表来管理展示内容的顺序。...实现一个循环列表在 JavaScript 中,循环链表是一种特殊的链表结构,其中最后一个节点指向头节点,形成一个循环。这种数据结构可以用于处理需要连续循环遍历的场景。

    15010

    JS 事件循环

    : 主线程:也就是 js 引擎执行的线程,这个线程只有一个,页面渲染、函数处理都在这个主线程上执行。...工作线程:也称幕后线程,这个线程可能存在于浏览器或js引擎内,与主线程是分开的,处理文件读取、网络请求等异步事件。...上述过程的不断重复就是我们说的 Event Loop (事件循环)。...在事件循环中,每进行一次循环操作称为tick,通过阅读规范可知,每一次 tick 的任务处理模型是比较复杂的,其关键的步骤可以总结如下: 在此次 tick 中选择最先进入队列的任务( oldest task...、process.nextTick(Node.js 环境) setTimeout/Promise 等API便是任务源,而进入任务队列的是由他们指定的具体执行任务。

    15.4K10

    Js正则Replace方法

    JS正则的创建有两种方式: new RegExp() 和 直接字面量。...就是匹配最多由1个字母或数字组成的字符串 六、test 、match 前面的大都是JS正则表达式的语法,而test则是用来检测字符串是否匹配某一个正则表达式,如果匹配就会返回true,反之则返回false.../\d+/.test("123") ; //true /\d+/.test("abc") ; //false match是获取正则匹配到的结果,以数组的形式返回 "186a619b28".match...第2个参数可以是一个普通的字符串或是一个回调函数 如果第1个参数是RegExp, JS会先提取RegExp匹配出的结果,然后用第2个参数逐一替换匹配出的结果 如果第2个参数是回调函数,每匹配到一个结果就回调一次...:记录本次匹配的开始位置 source:接受匹配的原始字符串 以下是replace和JS正则搭配使用的几个常见经典案例:  (1)实现字符串的trim函数,去除字符串两边的空格 String.prototype.trim

    11.9K100

    JS深浅复制

    ,只能处理JSON所能识别的key和value 通过循环处理来解决深复制爆栈问题 遍历树结构, 1....浅复制 VS 深复制 针对JS引用类型数据(复杂数据)的复制,有两种处理模式。...❝JS在语言层面「仅支持浅复制」,深复制需要手动实现 ❞ ---- 2. 浅谈浅复制JS中,存在几个内置属性天然支持数据浅复制,但是每个属性都有一定的适用条件和范围。...扩展运算符不能复制内置对象的特殊属性 我们在前面介绍JS数据类型的时候,介绍了在浏览器宿主环境下,JS = ECMAScript + DOM + BOM。...而解决递归爆栈,有两种方式 消除尾递归 改用循环处理 很明显,我们的递归处理函数不适合第一种方式,那就采用第二种,将递归函数改成循环函数。

    4.1K20
    领券