我正在学习文彤老师的《小白零编程网络爬虫实战》在线视频课程,这是第2篇学习笔记。
工欲善其事必先利其器,要不要编程写代码只是一个修饰词,但凡在网页上爬取数据,一定要有适合自己的趁手的武器,最开始看到这门课程的时候,我也很纳闷,无编程的网络爬虫,那它到底是哪一款工具呢?
我此前曾接触过八爪鱼、火车头,还有一款不怎么知名的叫做爬山虎的工具,所以很好奇这门课程会给学员介绍什么工具。
菜端上来之后,我发现是火车浏览器!
用火车头时看到过火车浏览器这个词,当时我还以为这是一个浏览器,你知道的,就是和IE浏览器一样的东西。直到看到文彤老师的介绍,我才明白原来它是可以模拟浏览器操作(点击、选中、翻页、确认验证码等动作)的强大脚本工具,自嘲孤陋寡闻,作为一个爬虫小白要反省一下:情报获取滞后,以后得加强。
说到小白,自从我听了文彤老师的观点之后,真的会有新的认识。
良苦用心一
1、小白真的以为自己是小白,所以可以顺其自然的、情有可原的对所有知识被动接受,别人说什么就是什么,很少能做到举一反三。
举个例子,爬虫小白跑到某无编程采集器官网了解情况,满眼看到的都是如何简单,如何强大,官网使劲的吆喝自己产品的优势,小白马上被动接受,眼里全是这款工具的优点,很少去了解这款工具的缺点是什么,官网一定不会告诉你自己的缺点。
看到武器的优点,你就会最大化发挥它的威力,看到武器的缺点,你就会懂得应该在恰当的场景时机下发挥它的威力。
文彤老师在课程中分享了自己对这些爬虫工具的认识,用自己的实践经验告诉我们每个工具的优缺点,小白们不再是被动接受孤立知识点,有对比就有伤害,然后我们对各款爬虫工具就会有深层次的认知。
良苦用心二
2、小白对于爬虫学习历程是模糊的,我是小白,我就不甚了解。我不太清楚我学习网络爬虫到底需要投入多少时间精力,是短期到手呢还是中长期钓大鱼?说实话是不知这个学习过程的深浅。
比如大家学R语言学Python,你紧张投入一个月时间,然后停了半年没有接触,我告诉你糟糕了,以前学的差不多都忘光光。
文彤老师在设计这门课的时候就想到了这个问题,所以这门课从一开始就是照顾小白的,他讲到这门课的目的就是要低成本学会网络爬虫技能,他讲得内容尽可能的是三五个月不使用不会忘记,需要使用的时候能迅速再拿起来。
这让我想起Excel的一些操作,不是说你学不会它,而是你此前不知道它。只要你知道了,并自己亲自操作过一遍,某些技术就真的是一辈子拿得起放得下。
下期预告
本期笔记先到这儿,目前我的学习进度是刚好完成第一章节,因为是挤出工作时间、生活时间安排的学习计划,进度略慢,不过现在已经开始使用火车浏览器了,下一期我会记录从这门课学习到的技能,与各位学员朋友共享心得。
如果你也有爬虫学习的需求,欢迎和我一起交流讨论,我会陆续发布这门课程的学习笔记,和读者朋友们分享知识。
报名课程,请扫一扫上图的二维码。
课程网址
https://study.163.com/course/introduction/1004712021.htm?share=1&shareId=4762287
本文文末点击阅读原文,深入了解这门课。
(全文完)
领取专属 10元无门槛券
私享最新 技术干货