http://dd.ma/8exSYWRJ
http://dd.ma/nlLdAQoa
上图为被选中的两张图片,当然我不确定是否合适,但是好像没有违和的地方。
首先从一个网站说起,它的链接是这样子的,前面的表示图组号,后面的表示张数,你没有看错,这套图确实是有50来张,至于总数嘛,我看了一下,可能有几万组。
图片链接我是直接右键粘贴得到的
./picuploads/XiaoYu/20220120/je4mnct1hll.jpg
它们不太一样的地方是这样子的,或者说是这样
je4mnct1hll.jpg
11位字母和数字组合,而图片只有50张,就比较难搞。
当然,我们并不是用手机打开的,所以可以查看源代码。
从一大串数字中,我们可以找到该图片的相对地址
这样一来,从理论上来说,我们就达成了爬取所以文件的基本条件。
现在的问题是,图片到底有多少?需要占用多少硬盘空间,以及我们能爬多少过来。
这一部分我还没做,先放在这里,说来也不难,就是获得这些html,然后提取相对地址,组合成绝对地址,然后下载文件就好。
领取专属 10元无门槛券
私享最新 技术干货