首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

高阶学习(二)

今天刚好看到关于百度的新闻,提及因为一篇文章吐糟百度,百度股价降了6%。非常好奇,我点开了原文,毫无疑问,文章的吐糟真实中肯。今天要谈及高阶学习里的一个很重要的能力——搜索。自学能力最重要的一环是搜索到适合自己的材料。适合这个词很容易被当成借口,比如,明明是自己的方法差,却要美其名曰适合自己的方法;明明是找到的对象差,却自欺欺人说适合自己的伴侣。虽然说优秀、好东西的明确标准难以界定,但这些概念是真实存在的。不需要所有人都认可的标准,特别是不需要很多平庸的人的标准;用你所属的那个群体的标准。所以对于我这个群体而言,百度就不是一个好工具,而Google是。

一、工具

因为特殊的原因,我们被围墙围起来,看不到外面的世界。所以在外面世界存在的好东西,在我们这个世界里,往往都有对应的“山寨版”。比如,Google 对应百度,Quora对应知乎,YouTube对应优酷,等等。大体上,有这些山寨版的东西,也基本上满足了基本需求,但对于高阶需求,就需要外面世界的最优秀的东西。所以第一步,明确你的需求,然后选择工具。

搜索引擎:

Google:https://www.google.com;

yandex: https://yandex.com;

baidu

百度的广告太多,每次寻找自己真正需要的东西往往需要花费更多的时间。Google对于英文和中文的搜索能力都很强大,容易定位到自己真正需要的东西。俄罗斯人的yandex也很强大,但中文能力估计差一些(输入科研利器,点image,输出都是AV女优的写真,叹为观止——来自一篇文章的研究)。如果英文够强大,yandex就很不错,它的翻译也非常棒。估计是用到了人工智能算法,英文和中文的互译不再是单字直译。

下面推荐一些网站。

[https://stackoverflow.com]

学习编程的人应该熟悉这里。这里有专业的问答,跟中文世界里不少胡说八道,不可同日而语。

[https://github.com]

这里存放了非常优秀的东西。那些牛人常常把自己的好东西放在上面分享。比如,源代码。学习源代码是提高编程能力的最佳方式。

这个是电子书最多的地方吧。特别是英文的。有钱的应该支持正版,穷的应该支持这样的盗版。从某种意义来说,这是劫富济贫。或者说,互联网一定程度上拉近了贫富之间的受教育资源。但这种差距依然存在,因为最好的教育资源是优秀教师。而对于穷孩子来说,只能接触不优秀的老师,不优秀的老师危害比贡献大。阶级是永远存在的,不要幼稚和天真。

[https://www.jiumodiary.com]

中文的电子书以及英文的电子书都可以在上面这个引擎里搜索。对于中文的世界来说,这是不错的开始。

[https://lovescihub.wordpress.com]

sci-hub这个网站是俄罗斯的汉子姑娘做出来的。那是相当了不起的工作。在上面大部分的论文可以下载。但是世界各大出版商高举正义的棍棒追打,它时常要变换域名。上面的网站每五分钟就更新sci-hub可用的网址。

二、方法

第一步是积累英文关键词。毕竟我们的母语是中文,很多对应的英文关键词需要积累。

我利用Python写一个爬虫自动下载论文到指定的路径遇到验证码的困难。我想收集对应的验证码,通过训练看能不能自动识别。首先,我在有道词典里查验证码对应的单词,有好几个对应英文词组。我选择verification code,在Google里输入verifiacation code,点image, 几乎没有我想要的图片。我再次在Google里输入验证码,

第一条就是

- 验证码(CAPTCHA)是“Completely Automated Public Turing test to tell Computers and HumansApart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。

然后,我输入CAPTCHA,这时,就是我想要的。同样的,我尝试在百度输入验证码,前面两条是广告,第三条才是验证码的介绍,而且字体较小,广告什么的最显眼。我观察了两个页面,Google出现的链接有这么个意思,当你输入一个关键词,Google认为你想知道这个关键词是什么东西,所以它把是什么放在前面,跟这个关键词合在一起的概念,同样是什么,放在往下的位置。基本上,我们查找一个东西,就是想知道它是什么。

我认为一个搜索引擎应该学会学习,在大量人的搜索记录下,知道某个关键词对应知识的频率,然后由高到低排列,这样,当后来人搜索时,他就有很大的概率得到他想要的知识。

第二步,Google搜索指令。Google搜索指令很多,找几个重要练习一下,比如,“”精确匹配,AND与, OR 或,-排除,define 定义,intitle 在标题内。或者调出高级搜索。

第三步,做实验。通过做实验学习指令,通过实验习得搜索的技巧。

优先考虑Google,找不到的时候,再用百度。有些时候,是有这种可能的。但不管怎么说,Google应该是老婆,要经常找;而百度是小三,偶尔找找就可以,绝不该频繁。

这里有个问题是,如果不用点办法,Google是上不了的。这个自己去学习吧,见不了天日。

(图片源于网络版权属于网络发布者,文章版权属于作者,引用、转载请与平台联系)

3

三分钟纵横,一个只做原创的公众号

为了情怀

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190203A04DGV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券