聊骚
这个小demo是昨天做的,用node爬掉了嘀哩嘀哩近期番剧的一些信息~
废话不多说,走起~
准备工作
创建一个新的文件夹,并创建以下文件:
目标
我们的目标很简单,就是把每部番剧的信息给爬取到。
那么我们先要开始定位啦~
找到我们要爬取的内容块,并找到对应的div,类名有两个:book和small。
但我们的不仅仅是要这块内容,而是要这块内容内番剧的url。
获取这个url有什么用呢?为的是要获取url指向的网页里的番剧内容~
我们随意进到其中一个番剧页面下看看~
我们很容易又找到了我们要获取的番剧信息,其在dd标签下~
简单搭个服务器
在你的index.js文件内写入如下代码:
测试效果
是不是感觉很有趣呢~
关注不吃亏
领取专属 10元无门槛券
私享最新 技术干货