Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >早发arXiv可多获得65%的引用,但……

早发arXiv可多获得65%的引用,但……

作者头像
量子位
发布于 2018-07-24 03:49:18
发布于 2018-07-24 03:49:18
1.1K0
举报
文章被收录于专栏:量子位量子位
原作 Sergey Feldman Root 编译自 Semanticscholar 量子位 出品 | 公众号 QbitAI

现在都流行投顶会或期刊之前,先把文章放arXiv上了。

对研究人员来说,这么做主要有两个好处。一方面尽早占坑,另一方面可以绕过漫长的同行评议时间,加速圈内人交流工作进展。

但是今天有个圈内的人,Sergey Feldman,认为这样不好。

Sergey Feldman,大数据和机器学习顾问

Feldman发了一篇文章The Association Between Early ArXiv Posting and Citations在arXiv,在文章里他用模型论证了,论文如果在会议接收之前发,会比接受后发多获得65%的引用次数。

他观察到,在arXiv上早发这个现象会促使大家急于立Flag,进而把文章的质量放在第二位。

另外,当作者的h指数很高的话(42~49),作者本身影响力会进一步助推文章的引用次数。这样大家只是被名人效应吸引才关注这篇文章所做的工作,而不是因为文章质量本身。

那学术圈里的马太效应要怎么破?

Feldman建议,以后arXiv文章提交时设置一个匿名时限。这样可以让学者们只以工作的质量论英雄。

简单介绍一下Feldman的统计条件和评估标准。

Feldman研究的论文对象得符合两个条件:

1)最后被会议或期刊接收的论文;

2)有投放在arXiv上的,接收前接收后都行。

另外,会议必须要是重量级的,只考虑被AAAI、ACL、CVPR、ECCV、EMNLP、FOCS、HLTNAACL、ICCV、ICML、ICRA、IJCAI、INFOCOM、KDD、NIPS、SODA、WWW接收的论文。

还有论文发表时间是限定在2007年到2016年之间,引用次数只考虑会议中稿当年的数据。

符合这些条件的论文,一共有4392篇。

16个顶会分别符合统计标准的论文数

单一的评价尺度可能会有失偏颇。Feldman特定制定了两个不同的评估标准。

一个是看这4千多篇论文在中稿当年的总引用次数。另外一个是排除了作者在以后工作的自引用情况,而且引用的重要程度要很高,在在同一篇文章里,该篇被统计的文章被引用次数要达到3次及以上,才算数。

Feldman建模分析后发现,按第一个标准,接收前发比接收后发的引用次数要多65%。按第二个标准,早发比晚发的引用次数要多75%。

这个数字可以说是相当震惊了。

分析完之后,Feldman解释了一下他做这个研究的目的。

他主要是想看,早发晚发对引用量的影响,也一带研究上作者知名度、文章被接受的会议类型、提前多早发这些变量对引用次数的影响。

他也坦承,这次统计也还有可以改善的部分。比如应该补充变量,像是文章作者所属的研究机构或学校,以及文章质量本身。

最后,为了学术圈更纯粹一些,他建议arXiv开设作者匿名时限就像ICLR 2018的OpenReview平台那样。

想详细地了解统计的模型,可前往: https://arxiv.org/abs/1805.05238

以及,附上原文地址: https://blog.semanticscholar.org/the-association-between-early-arxiv-posting-and-citations-72034f0914b2

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AAAI 25年数据分析:CMU贡献最大,谷歌无人车之父为最TOP作者
AAAI的英文全称是 Association for the Advance of Artificial Intelligence。是人工智能领域的顶级会议。第一届会议在1994年召开,到2019年已经是第33届。
大数据文摘
2019/03/04
1.1K0
AAAI 25年数据分析:CMU贡献最大,谷歌无人车之父为最TOP作者
"未曾抄袭SGC",关于ICML-2019高引用图神经网络论文SGC
英文原文:About the Highly-Cited ICML-2019 GNN Paper SGC
Houye
2022/04/15
3880
"未曾抄袭SGC",关于ICML-2019高引用图神经网络论文SGC
习惯arXiv的今天,我们的论文应该引用预印本吗?
选自fossilsandshit 作者:Jon Tennant 机器之心编译 参与:吴攀、李泽南 不久之前,ICLR 匿名评审的方式引起了争议,参见机器之心文章《ICLR 2017 匿名评审惹争议,盘点 10 篇被拒却值得一读的好论文》。但围绕学术研究不只有评审的问题,还有引用的问题。近日,一篇讨论是否应该引用预印本论文的文章引起了广泛讨论。本文作者 Jon Tennant 来自英国帝国理工大学,地球物理博士学位,他也是古生物学预印本平台 PaleorXiv 的创建者之一。在这篇文章之后,机器之心还整理了
机器之心
2018/05/07
2.1K0
习惯arXiv的今天,我们的论文应该引用预印本吗?
学界 | 从NIPS到NeurIP 20年数据分析:MIT贡献最大,吴恩达、Hinton为最TOP作者
NeurIPS(前称NIPS)可谓人工智能年度最大盛会。每年的圣诞前夕,全球的人工智能爱好者和科学家都聚集起来发布最新研究,并进行热烈探讨。这不仅是一次大的party,也是一次重要的技术发展指向,大会的技术往往这未来几年就会演变成真正的研究甚至应用成果。
大数据文摘
2018/12/21
1.3K0
Nature:16年前的论文生成软件SCIgen至今仍有人用,骗过同行评审,论文被接收
文章地址:https://www.nature.com/articles/d41586-021-01436-7
机器之心
2021/06/08
7700
学界 | Science评论「抵制Nature子刊」事件:为什么AI研究者热爱arXiv与OpenReview?
选自Science 作者:Matthew Hutson 机器之心编译 参与:蒋思源、路、刘晓坤 前几周,很多热爱开放式学术环境的研究者联合抵制了 Nature Machine Intelligent
机器之心
2018/06/08
9920
IJCV论文与arXiv论文神似,arXiv,是占坑神器还是剽窃利器?
今天,Reddit一位好奇宝宝网友在「网上冲浪」的时候,发现了这一不可思议的事情。
3D视觉工坊
2021/07/27
5830
「arXiv就是毒瘤」ACL主席暴论被声讨,网友:我们换个顶会投吧
「arXiv 是个毒瘤,它以貌似实物出版的形式促进垃圾『科学』的传播,并一直在宣扬盲目跟风 + 任何超过 6 个月的内容都过时了的计算机科学文化。」
机器之心
2023/09/08
5090
「arXiv就是毒瘤」ACL主席暴论被声讨,网友:我们换个顶会投吧
ACL新政禁止投稿论文在arXiv公开,我们到底需要什么样的双盲评审?
ACL的论文投稿,截稿日期前一个月不允许传arXiv。是直接接受双盲评审的新政,还是与拖延症做对决?
AI科技评论
2018/07/26
1.5K0
ACL新政禁止投稿论文在arXiv公开,我们到底需要什么样的双盲评审?
ICML 2019论文录取Top100:谷歌霸榜
据了解,今年ICML共提交3424篇论文,其中录取774篇,论文录取率为22.6%。录取率较去年ICML 2018的25%有所降低。
磐创AI
2019/05/17
5520
ICML 2019论文录取Top100:谷歌霸榜
真·论文收割机!谷歌169篇霸榜NeurIPS2020,清华稳居国内第一!
今年,NeurIPS论文提交数再次创新高,与去年相比增加了38%。但是,论文接收率相比来说,稍有下降。
新智元
2020/10/19
7710
真·论文收割机!谷歌169篇霸榜NeurIPS2020,清华稳居国内第一!
顶会竟然攀比起了拒稿率?UCB教授发文怒斥「挑刺式审稿」
---- 新智元报道   编辑:David 好困 【新智元导读】这几年,计算机顶会的论文接收率连续走低,不到20%都快成家常便饭了,难道真是「接受率越低,会议越顶」? 与大多数学科不同,在计算机科学领域,会议论文的分量比期刊论文分量更重。 有趣的是,现在的CS顶会们,似乎对「接收率」有一种近乎偏执的追求。 好像这个数字越低,自己就越厉害一样。 举个例子: IJCAI的接收率,在2019年突破20%大关,达到了17.9%。并在次年以12.6%的接收率,刷新了最低纪录。此后的两年,接收率有所回升,分别为1
新智元
2022/08/29
4580
顶会竟然攀比起了拒稿率?UCB教授发文怒斥「挑刺式审稿」
你的论文能否中顶会?这篇分析同行评审结果的论文可帮助你
选自arXiv 作者:Dongyeop Kang等 机器之心编译 参与:Nurhachu Null、李亚洲、李泽南 在人工智能领域,会议论文是证明研究人员学术水平的重要一环。是否存在一些「技巧」可以提高论文被大会接收的几率?人工智能是否可以帮助我们?近日,来自卡耐基梅隆大学(CMU)研究者们收集了上万篇 AI 顶级会议的接收/被拒论文,并使用机器学习工具进行分析,获得了一些有趣的结果。最后,当然……这一研究的论文已经被即将在 6 月 1 日于美国举行的自然语言处理顶会 NAACL 2018 接收。 项目
机器之心
2018/06/08
8920
原创 | arXiv上成功发表的预印本有什么特征?这样写,你的论文也能中!
“预印本(preprint)是一份完整的科学论文手稿(通常也会同时提交给需要同行评审的期刊),由作者在未经过评审的状态下上传至公共平台”。预印本平台的用户可以不经过严格的同行评审,在简单的审查之后,发布自己的手稿。尽管预印本的“预”表示出版前的预提交概念,但也存在大量出版后提交给预印本平台的后印本(post-print)。在本文中,将“预印本”定义为“e-print”,同时代表预印本平台上的“预印本”和“后印本”。“未发表”一词用于描述一篇预印本尚未被任何类型的出版物接收的状态。“发表”一词用于描述预印本已经过同行评审,并在期刊、会议、书籍、报告或其他类型的出版物中正式刊登(包括在线优先刊登)的状态。
数据派THU
2023/03/29
1.3K0
原创 | arXiv上成功发表的预印本有什么特征?这样写,你的论文也能中!
大名鼎鼎的YOLO、PageRank影响力爆棚的研究,曾被CS顶会拒稿
机器之心报道 机器之心编辑部 仔细一查吓死人。 在机器学习等领域,是否被顶会接收被认为是一种论文质量评价标准,但并不是唯一的标准。随着深度学习的广泛发展,机器学习顶会的投稿数量呈爆炸式增长,在被拒稿的论文中也有很多颇具影响力的研究。 近日,Reddit 上就有一个帖子引起网友热议:哪些论文是被顶会拒稿,但却非常有影响力?令人惊讶的是网友列举出一些家喻户晓的研究,包括 YOLO、transformer XL,甚至还有 Google 搜索引擎的网页排名算法 PageRank。 发帖人表示机器学习顶会的审稿机制
机器之心
2022/07/18
5020
大名鼎鼎的YOLO、PageRank影响力爆棚的研究,曾被CS顶会拒稿
负起责任、审慎对待论文创新和性能指数,ACM Fellow罗杰波教授分享他的审稿经验
如何客观地审阅 AI 领域的论文,以及如何确保审阅出来的论文足够公正并使论文作者没有异议呢?对于这个话题,每个研究者想必都有自己的理念和方法。
机器之心
2020/07/21
4350
CVPR 高引论文往往无缘 Best paper,「最佳」一定「高引」吗?
我们对60多个顶级国际会议的最佳论文和高引论文进行了分析,惊讶的发现只有10%的最佳论文最后成了真正的高引论文。是评奖委员会选错了吗?不同研究领域的最佳论文和高引论文又有什么特点呢?数据表明SIGGRAPH、SIGSPATIAL以及硬件等会议更“靠谱”(MAP值普遍大于0.5);也有很多会,比如人工智能会议NIPS、CHI、CVPR、KDD、AAAI、ACL、IJCAI等会议的高引论文往往无缘最佳论文。来查查你的会议表现吧:https://aminer.cn/bestpaper
AI科技评论
2019/09/25
1.6K0
CVPR 高引论文往往无缘 Best paper,「最佳」一定「高引」吗?
同行评审以权谋私,让投稿人多引用自己文章,爱思唯尔将彻查此事
爱思唯尔发现,某些同行评审正在滥用自己的权力,提高自己文章的引用率。他们会在投稿人的在审稿意见中加入一句提醒:“请参考XXX文献”,而这篇文献往往是审稿人自己的文章。
量子位
2019/09/17
5500
同行评审以权谋私,让投稿人多引用自己文章,爱思唯尔将彻查此事
年均18篇论文,这位清华博三学生今年已发3篇Narure子刊!网友:为了发文而发文
大数据文摘出品 作者:Caleb 终于熬到了毕业,从大学离开的大学生们也终于离开了那个噩梦。 没错,文摘菌说的就是论文。 但是你敢信,这个大部分学生的心头痛,竟然也能“卷”起来? 最近知乎上就被一个清华博士在读期间发表了100多篇论文这件事掀起了又一股讨论热潮。 根据统计,从2017年截止到2022年7月27日,这位清华大学电子工程系的博三同学武楚涵已经发表了108篇论文,平均一年发表论文18篇。 其中不少更是来势汹汹,比如arXiv的一作论文,武同学就手握67篇。CCF A类推荐会议/期刊共计22篇;C
大数据文摘
2022/08/26
8280
年均18篇论文,这位清华博三学生今年已发3篇Narure子刊!网友:为了发文而发文
ICML 审稿人怒了,不要论文没写完就投稿!
ICML作为国际机器学习大会在一些学者心中的地位很高,不仅因为它是所谓的顶会,更因为它在论文评审方面所做的一些开创性的工作。
AI科技评论
2020/03/20
1.6K0
推荐阅读
AAAI 25年数据分析:CMU贡献最大,谷歌无人车之父为最TOP作者
1.1K0
"未曾抄袭SGC",关于ICML-2019高引用图神经网络论文SGC
3880
习惯arXiv的今天,我们的论文应该引用预印本吗?
2.1K0
学界 | 从NIPS到NeurIP 20年数据分析:MIT贡献最大,吴恩达、Hinton为最TOP作者
1.3K0
Nature:16年前的论文生成软件SCIgen至今仍有人用,骗过同行评审,论文被接收
7700
学界 | Science评论「抵制Nature子刊」事件:为什么AI研究者热爱arXiv与OpenReview?
9920
IJCV论文与arXiv论文神似,arXiv,是占坑神器还是剽窃利器?
5830
「arXiv就是毒瘤」ACL主席暴论被声讨,网友:我们换个顶会投吧
5090
ACL新政禁止投稿论文在arXiv公开,我们到底需要什么样的双盲评审?
1.5K0
ICML 2019论文录取Top100:谷歌霸榜
5520
真·论文收割机!谷歌169篇霸榜NeurIPS2020,清华稳居国内第一!
7710
顶会竟然攀比起了拒稿率?UCB教授发文怒斥「挑刺式审稿」
4580
你的论文能否中顶会?这篇分析同行评审结果的论文可帮助你
8920
原创 | arXiv上成功发表的预印本有什么特征?这样写,你的论文也能中!
1.3K0
大名鼎鼎的YOLO、PageRank影响力爆棚的研究,曾被CS顶会拒稿
5020
负起责任、审慎对待论文创新和性能指数,ACM Fellow罗杰波教授分享他的审稿经验
4350
CVPR 高引论文往往无缘 Best paper,「最佳」一定「高引」吗?
1.6K0
同行评审以权谋私,让投稿人多引用自己文章,爱思唯尔将彻查此事
5500
年均18篇论文,这位清华博三学生今年已发3篇Narure子刊!网友:为了发文而发文
8280
ICML 审稿人怒了,不要论文没写完就投稿!
1.6K0
相关推荐
AAAI 25年数据分析:CMU贡献最大,谷歌无人车之父为最TOP作者
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档