写在前面:小伙伴们的小建议,DC君都一一get了~
那么从今天开始,就让DC君来逐渐实现小伙伴们的需求吧~
进入到一个新的领域,怎样才可以解除懵逼状态呢?第一步,DC君给你的建议就是阅读学术前沿论文,知道学科水平的发展以及技术的更新,才能让你逐渐从小白走向大神。
不过,论文从何而来?
这是一个好问题!传统的论文检索,浩如烟海的结果是不是会让你无所适从?如何根据你的兴趣和爱好来便捷、靠谱地检索论文呢?试一试人工智能检索引擎!
来源:公众号“玉树兰芝”
作者:王树义
烦恼
进入一个新领域,读论文是必然途径。
读者一般会遇到2个问题:
如何获取论文全文;
如何筛选该读哪些论文。
在信息匮乏时代,第一个问题就会难倒许多人。
好在近年来,人们有了获取全文的更多渠道。
例如在物理、数学和计算机科学等领域,绝大多数新研究成果,都会首先发在arXiv这个预印本平台上。
解释一下,预印本是指你的论文写好,可以先发上来,然后再投给会议或者期刊。
在同行评议过程完成之前(这个时间段长短不一,真的有按年计算的),别人可以抢鲜读到你的工作成果,同时你上传预印本的行为也申明了自己的知识产权。
这样一来,人们就更关注第二个问题了:
如何找到自己需要的论文?
这个问题越来越难以解决。
因为论文太多了。
发展较快的领域,尤其如此。
例如人工智能领域,自从深度学习(Deep Learning)成为了显学,大批量的研究者就涌了进来。一时间好不热闹。
这么多的论文里,你该读哪些?以什么顺序来阅读?
要圆满解决这些问题,你可能需要拥有一张完整的领域知识地图。
可惜,人类的阅读速度,都跟不上新论文的发表速度了。几乎没有哪个人能拥有这张知识地图(而且还恰好愿意为你提供咨询服务)。
这给初学者造成了非常严重的困扰。
有人会告诉你:多读。
读到你不再是初学者,就好了。
这个建议放在今天,恐怕还是要被信息的洪流淹没。
正如庄子说的那样:
吾生也有涯,而知也无涯。以有涯随无涯,殆已!
幸好,恰恰是人工智能技术的发展,使得人们有了更加强大的武器,来应对海量论文奔涌而来的困局。
本文为你介绍一款基于人工智能的arXiv论文检索与推荐引擎,来帮助你处理论文查找和筛选问题。
检索
我为你推荐的这个论文检索引擎,叫做arXiv-sanity。
这是首页的样子。
第一次使用的时候,建议你点击这个链接(https://youtu.be/S2GY3gh6qC8)查看介绍视频。
为了使用这个检索引擎,你需要创建一个账户。
别怕麻烦,10几秒钟就能完成。只是你需要把密码记录下来,以免下次忘记。
这是我账户创建完毕的样子。
我们来对比一下,arXiv和arXiv-sanity中,依据关键词检索论文的结果有什么差异。
在arXiv里面,搜索“keras”,结果是这个样子的。
看着中规中矩,对吧?
而在arXiv-sanity中搜索同样的关键词,结果是这样的:
arXiv-sanity的搜索结果以更加可视化的形式呈现。你不仅可以看到标题、作者等信息,而且还可以直观看到其中正文的预览图。
这样一来,一眼扫过去,你就可以观其大略,发现某篇论文是否符合你的口味。
我的研究生应该会比较喜欢这个功能。这样他们寻找候选翻译论文的时候,就能尽量避开公式太多的了。
基于关键词的检索是最为基本的功能。
我们来看看其他服务。
群体
一篇论文写得如何?其他用户可能会有评论。
点击“Discussions”按钮,你就能查看评论,从而了解他人眼里,论文的优点与不足了。
如果你暂时还没有确立自己的研究方向与兴趣,也没有关系。
这套论文检索系统充分利用了人类用户的群体智慧(crowd wisdom),即观察和分析他人的行为,来帮你找到可能感兴趣的论文。
尝试一下,点击屏幕上方的“top recent”按钮。
系统会根据他人在文献库收藏的情况,为你推荐一周内最受欢迎的论文。
当然你也可以自己选择时间尺度。我们来尝试一下“All Time”(全部时间段)。
深度学习领域大牛Ian Goodfellow的论文NIPS 2016 Tutorial(发表于2017年)排在第一位。
但是使用这个检索系统的人毕竟还有限。少数人的关注,可能不足以说明问题。
没关系,这个系统还和社交媒体平台Twitter链接了起来。
点击屏幕上方的“top hype”按钮,你会看到以下界面。
你可以试试把鼠标滑动到某个Twitter用户头像上,直接看TA说了什么。
当然,社交媒体平台上的数据,也并非完全相关与可靠。但是对于科研内容的评价和传播来说,社交媒体数据(评论、转发等)还是比较有参考价值的。
毕竟,愿意研究论文的人,大致上还是有一定的学术基础,并且比较珍视自己的名誉,因此胡乱评价的概率较低。
将检索平台自身的收藏数量和社交媒体推荐相互印证,你就不难找到一些引领趋势的研究成果。
可是,这些成果虽然代表了流行程度和受关注度,却未必符合你的胃口。
这就该人工智能上场了。
智能
你可以通过文章内容的相似性寻找符合口味的论文。
回到我们刚刚检索“Keras”的第一个结果下,点击“show similar”,就能看见以下分析结果。
系统通过自然语言处理后,认为与该研究相关的文章都被列出来了。
我们检索的Keras是一种深度学习框架,结果标题中出现Theano也是。看来机器帮我们找的相似性还是比较靠谱的。
比起人工推荐同类研究论文,arXiv-sanity这样的计算机系统可以不知疲倦地随时监测,实时发现新的结果,并且及时通知用户。
这样一来,你做文献综述的时候,心里就会更有底了。
我们来看看更智能的应用——论文推荐。
如果说相似结果查找还不过是照猫画虎,论文推荐可就是见微知著了。
在检索结果中,咱们选择一些感兴趣的论文,将它们存入到自己的独立文献库(Library)中。点击那个软盘模样的存盘按钮就可以。
被收藏的文章,存盘按钮变成了蓝色。
进到我们的文献库里看看。
你的检索、阅读和保存等动作都在给arXiv-sanity系统传递信号。
领取专属 10元无门槛券
私享最新 技术干货