前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?

【杂谈】如何学会看arxiv.org才能不错过自己研究领域的最新论文?

作者头像
用户1508658
发布于 2019-07-26 09:10:22
发布于 2019-07-26 09:10:22
1.4K0
举报
文章被收录于专栏:有三AI有三AI

1 什么是arxiv-sanity

我们都知道arxiv.org是一个非常大的预印本资源库,里面有大量的最新的论文,但缺点是浏览、搜索和排序不是很方便。这个库每天会更新大量的论文,如果只是通过手动搜索和浏览效率就太低了。

这样特别容易让人和一些优秀的有趣儿的论文擦肩而过,这些论文可能是和你的研究领域相关的。所以接下来你可能就能猜到这个arxiv-sanity是干什么用的了。

网址为:http://www.arxiv-sanity.com/

2 arxiv-sanity的基本功能

1、便捷的预览

首先,arxiv-sanity在展示最新更新的文献时,提供了可读性更强的缩略图预览模式方便读者来快速预览,并在缩略图下方的绿色区域显示文献的abstract 。

2.感兴趣相关度排序

更重要的是,它可以让你根据自己的阅读兴趣对文献进行重新排序。比如这里有一篇关于对人体姿态估计的文献是你感兴趣的,点击右上角的' rank by tf-idf similarity to this',文献列表会按照与这篇文章的相关度进行排序,接下来我们会看到arxiv上所有关于人体姿态识别的论文。这个功能是基于TF-DF算法来实现的,效果很好。(一种文档特征提取法,它是由Salton在1988 年提出。其中TF称为词频, IDF称为反文档频率, 感兴趣的可以自己百度。)

3.个人图书馆

如果你是注册用户,在登录账户之后,还可以把自己感兴趣的文献收藏到你的个人图书馆。比如,我喜欢上图的这篇人体姿态估计的文献,点击右上角存盘图标,(看到了吗?就在' rank by tf-idf similarity to this'下面),点击之后就把这篇文献存在我自己的library里面了。

这时,刚刚黑色的图标变成了蓝色,点击上面的library标签,可以看到它出现在了最上方。你可以像这样收藏很多自己感兴趣的文献。想删除的时候,在自己的library里面再次点击那个图标就可以删除了。

4.感兴趣推荐系统

另外,library不光是用来收藏和跟进自己领域的论文更新进度,arxiv-sanity可以通过你收藏的内容给你推荐你也许会感兴趣的论文。具体怎么实现的呢?library内部的论文会被标记为positive,Library之外的论文标记为negative,然后arxiv-sanity基于bigram文本特征提取来训练你的personal SVM,然后在reconmmended 标签里推荐给你。点击recommended标签你就可以看到最近两周arxiv-sanity认为你会感兴趣的文献。当然,你也可以通过设置时间来自己筛选,如去年,上个月,上周,昨天和全部,看看自己有没有错过什么文献。

5.看看大家都在看什么

最后,再介绍一下“top recent”标签。这里面展示的是arxiv-sanity上被用户收藏最多的文献。这些文献也可以按照时间来筛选。即使你不是注册用户,你也可以浏览到大家都在收藏的文献。

6.网站代码开源

在页面上方可以看到,arxiv-sanity只展示machine learning的论文,如CV,CL等ML的分支领域,因为这是arxiv-sanity作者自己的研究领域。(对,这是人家闲暇时间写的)。作者已经把arxiv-sanity开源了,所以如果你想根据自己的研究领域新建自己的arxiv-sanity,可以去GitHub自己fork。GitHub搜索 karpathy/arxiv-sanity-preserver。

各分支领域缩写翻译如下:

cs.CV: Computer Vision and Pattern Recognition 计算机视觉与模式识别;

cs.CL:Computation and Language 计算语言学;

cs.LG:Learning 机器学习(计算机科学);

cs.AI:Artificial Intelligence 人工智能

cs.NE:Neural and Evolutionary Computing 神经与演化计算;

stat.ML:Machine Learning 机器学习(统计学)。

好了,就是这样,赶快用起来吧。

总结

能够及时地找到自己感兴趣领域里最新最全的资料,本身就是一种学习能力,如果你有更好的推荐方法和建议,不妨来有三AI分享,一起成长吧。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 有三AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
计算机视觉邻域论文查找方法
https://dblp.uni-trier.de/db/conf/icml/icml2017.html
狼啸风云
2019/08/29
1.5K0
计算机视觉邻域论文查找方法
使用 arxiv-sanity &paperwithcode 跟进最新研究领域的文章
arxiv.org是一个非常大的预印本资源库,里面有大量的最新的论文,但缺点是浏览、搜索和排序不是很方便。这个资源库每天会更新大量的论文,如果通过手动搜索和浏览则效率很低,高引用的好文章难以及时的找到并阅读,造成时间的浪费。从而,arxiv-sanity 因运而生。
汀丶人工智能
2022/12/21
1.1K0
使用 arxiv-sanity &paperwithcode 跟进最新研究领域的文章
如何用人工智能帮你找论文?
传统的关键词检索论文,浩如烟海的结果让你无所适从?试试人工智能检索引擎。根据你的研究兴趣和偏好,便捷而靠谱帮你找论文。
王树义
2018/08/22
8810
如何用人工智能帮你找论文?
独家 | 28303篇论文体现机器学习领域的发展变化
原文标题:A Peek at Trends in Machine Learning 作者:Andrej Karpathy 翻译:贾琳 全文校对:闵黎 本文约1700字,建议阅读时间4分钟。 OpenAI是由诸多硅谷大亨联合建立的人工智能非盈利组织,目的是预防人工智能的灾难性影响,促使人工智能发挥积极作用。本文由OpenAI的研究人员Andrej Karpathy撰写,主要陈述了他通过分析机器学习论文数据库arxiv-sanity里面的28303篇论文里面的高频关键词所发现的有趣的结论。 你是否用过谷歌
数据派THU
2018/01/29
6300
独家 | 28303篇论文体现机器学习领域的发展变化
来试试读论文的新神器!AMiner发布“论文背景文献”一键生成工具,帮你搞清一篇论文的“来龙去脉”
来自 DBLP、ArXiv、STM 等多家学术出版机构和平台的数据表明,在过去 20 年间,计算机科学、物理学、统计学等研究领域的出版物总量都有大幅增加。像 CVPR、AAAI 等有关人工智能等新兴领域的顶级会议,每年的论文接受量也已经高达上千篇。面对雨后春笋一样涌现的学术出版物和千上万篇学术论文,任何一名研究者都不可能了解所有新领域,即使这一领域和自己的研究方向近似。
一点人工一点智能
2022/12/27
7580
来试试读论文的新神器!AMiner发布“论文背景文献”一键生成工具,帮你搞清一篇论文的“来龙去脉”
如何阅读机器学习论文
在这里我不会试图说服你为什么需要阅读技术和研究论文。我们在日常生活中使用的几乎所有算法都来自技术文献或者以教程或更简单的代码形式出现。你很有可能会遇到一些非常深奥和简洁的问题,而没有任何标准的教科书解决方案,这时,通过阅读密集的技术文献来分析这些问题就派上用场了。
deephub
2021/09/15
4520
15-好物分享-readpaper低调的论文阅读管理一站式神器
我已经很久没有这么兴奋了。上一次还是好物分享第六弹——让zotero成为你的文献图书馆
北野茶缸子
2021/12/17
2K0
15-好物分享-readpaper低调的论文阅读管理一站式神器
万字长文综述:给你的数据加上杠杆——文本增强技术的研究进展及应用实践
文章系统性地回顾了自然语言处理领域中的文本增强技术在近几年的发展情况,重点列举和讨论了 18 年、19 年中人们常用的五类文本增强技术路径以及对应的代表性技术。接下来,文章以金融领域的自然语言处理任务入手,多维度地分析几类通用文本数据增强技术在实际业务问题上的重要价值。文章的结论是,文本增强技术是一类低成本的数据杠杆,可以在不引入新数据下,有效撬动模型性能。
机器之心
2020/04/02
9450
一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事
今年是它创立20周年,两位创始人Alex Verstak和Anurag Acharya特地为此撰写了一篇博客。
新智元
2025/02/15
1190
一只暹罗猫竟是论文作者!谷歌学术20岁,创始人首次公开最魔幻学术故事
数据分析:文本分类
本章节中所涉及的知识点偏向于机器学习的范畴,那么机器学习和数据分析有什么区别呢。简单来讲,数据分析是少量数据采样分析而机器学习是海量数据全部分析。比较好的理解一点是,数据分析会总结过去已经发生的事情,而机器学习是为了预测未来发生的事情。这两者也是有相辅相成的关系。我们可以通过机器学习预测的结果,进行数据分析,得到一个相对准确的结论,辅助人们进行决策判断等等。
马拉松程序员
2023/09/02
4130
数据分析:文本分类
深度学习(九):推荐系统的新引擎(9/10)
深度学习在推荐系统中的融合并非偶然。随着互联网的飞速发展,数据量呈爆炸式增长,传统推荐系统面临着诸多挑战。例如,在处理大规模、高维度的数据时,传统方法往往显得力不从心。而深度学习以其强大的特征提取和非线性建模能力,为推荐系统带来了新的机遇。
正在走向自律
2024/12/18
1980
深度学习(九):推荐系统的新引擎(9/10)
【机器学习】基于LDA主题模型的人脸识别专利分析
作为一名数据科学家,文本数据提出了一个独特的挑战:虽然金融、年龄和温度数据可以立即被注入线性回归,但词汇和语言本身对统计模型毫无意义。
黄博的机器学习圈子
2021/07/07
1.1K0
【机器学习】基于LDA主题模型的人脸识别专利分析
最新的计算机视觉趋势来自CVPR 2019
CVPR引领计算机视觉领域的顶尖人才,每年都有很多非常令人印象深刻的论文。对CVPR中的论文进行了分析,以了解研究的主要领域和纸质标题中的常用关键词。这可以表明研究的进展。
代码医生工作室
2019/08/15
9070
zblog明信片主题类型模板全新绽放,R角、透明、森系您想要的我都有
HI,大家好,首先先介绍下大家比较关心的几个问题,首先需要安装zblogPHP版本(一般来说安装最新版即可),不会安装的查看此地址:zblog安装图文教程,附zblog主题下载及使用教程,程序安装完成之后,需要下载和开启主题,如果您是在应用中心购买的,可以忽略前半部分,直接查看主题设置内容接口,否则请继续查看教程。
李洋博客
2023/03/03
2.1K0
zblog明信片主题类型模板全新绽放,R角、透明、森系您想要的我都有
独家 | 一文读懂推荐系统知识体系-上(概念、结构、算法)
本文主要阐述: 推荐系统的3个W 推荐系统的结构 推荐引擎算法 浏览后四章的内容请见下篇。 1. 推荐系统的3个W 1.1 是什么(What is it?) 推荐系统就是根据用户的历史行为、社交关系、
数据派THU
2018/03/26
3.5K0
独家 | 一文读懂推荐系统知识体系-上(概念、结构、算法)
zblogPHP万能型主题模板希望(Hopelee)全新绽放,独具热爱,自成一派
HI又发布新主题了,这半年过的实属不易,如人饮水,冷暖自知啊,人类的悲喜并不相通,悲喜自渡是我们一生的必修课,无论怎样我们始终要相信人生总会有不期而遇的温暖和生生不息的希望! 所以我们新款主题的名称就是“希望”,有了希望就有奔头,我遵循的是1+1=N的风格,可能这也是很多人说我的主题模板风格很相似的原因吧。不管怎样,喜欢就好,毕竟追求源于热爱。先介绍下大家比较关心的几个问题,首先需要安装zblogPHP版本(一般来说安装最新版即可),不会安装的查看此地址:zblog安装图文教程,附zblog主题下载及使用教程,程序安装完成之后,需要下载和开启主题,如果您是在应用中心购买的,可以忽略前半部分,直接查看主题设置内容接口。
李洋博客
2023/03/03
2.4K0
zblogPHP万能型主题模板希望(Hopelee)全新绽放,独具热爱,自成一派
专栏 | 阿里KDD2017论文:基于大规模图计算的本地算法对展示广告的行为预测
机器之心专栏 作者:杨红霞(阿里集团)、Yada Zhu (IBM Watson)、Jingrui He (亚利桑那州立大学) 在 2017 国际知识发现与数据挖掘大会(KDD)全球论文投稿中,阿里集团和蚂蚁金服共有 5 篇论文被大会收录,本次被收录论文涵盖深度学习、大规模图计算、商品智能排序等多个研究领域,基于真实的业务场景或数据样本,文中部分方法结论已经在业务中运用。如深度学习语义建模研究中提出了一种新的文本语义编码算法 conv-RNN,该模型在参考了较为常用的文本语义编码模型循环神经网络与卷积神经
机器之心
2018/05/09
1K0
工具 | 使用 arXiv API + Github Actions 实现每天自动获取arXiv论文摘要
Hi大家好,我是Realcat,最近周末爆肝搞了个自动获取arXiv论文的小工具,感兴趣的同学可以看下。
好好学SLAM
2021/11/05
2.4K0
工具 | 使用 arXiv API + Github Actions 实现每天自动获取arXiv论文摘要
从CVPR2019看计算机视觉的最新趋势
我从CVPR中选取已被录用的论文进行分析,了解研究的主要领域和论文题目中的常见关键词。这可以提供研究进展的一个迹象。
AI算法与图像处理
2019/08/23
6000
从CVPR2019看计算机视觉的最新趋势
Logistic Regression Models分析交互式问答译
本文是一篇关于交互式问答系统中如何通过文本特征工程构建和Logistic Regression判定话题/主题/意图延续还是转换的论文,提供了一条比较好的思路,对于整理问答语料以及问答系统都有很大的指导意义。 由于时间和小编水平都有限的情况,翻译理解不当的地方,请大家提出来,我们一起优化。原文: AnalyzingInteractive QA Dialogues using Logistic Regression Models 摘要 传统的问答(QA)系统已经达到了近乎令人满意的性能,而新的挑战是交互式问答(
企鹅号小编
2018/01/16
5460
Logistic Regression Models分析交互式问答译
推荐阅读
相关推荐
计算机视觉邻域论文查找方法
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档