Loading [MathJax]/jax/input/TeX/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队

又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队

作者头像
机器之心
发布于 2022-06-29 08:49:26
发布于 2022-06-29 08:49:26
5120
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

编辑:张倩

「他们并不是照抄文本,而是剽窃想法。」

昨天,有人在 reddit 上发帖称,IBM 苏黎世研究中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。

这位发帖者写道:

我叫 Xianbiao Qi,是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世研究中心的员工蓄意剽窃我们的论文。他们并不是照抄文本,而是剽窃想法。

Qi 提到的疑似被抄袭的论文题为「PingAn-VCGroup's Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML(平安 VCGroup 为 ICDAR 2021 科学文献解析竞赛任务 B 提供的解决方案:HTML 表格识别)」,作者来自平安保险和平安科技,上传 arXiv 的时间是 2021 年 5 月份,2021 年 7 月份公布了代码,2021 年 9 月发布了 Tablemaster 预训练模型,2021 年 11 月发布了 tablemaster_mmocr docker 环境。论文中提到的竞赛是 2021 年 4 月结束的,由 IBM 的另一个团队主办。

论文链接:https://arxiv.org/pdf/2105.01848.pdf

如论文标题所述,这篇文章为 ICDAR 2021 科学文献解析竞赛任务 B(HTML 表格识别)提供了一套解决方案。具体来说,他们将表格内容识别分为四个子任务:表格结构识别、文本行检测、文本行识别和框分配。表格结构识别算法是基于一种鲁棒的图像文本识别算法 MASTER 定制的。PSENet 用于检测表图像中的每个文本行。文本行识别模型也建立在 MASTER 之上。最后,在框分配阶段,他们将 PSENet 检测到的文本框与通过表结构预测重构的结构项相关联,并将文本行的可识别内容填充到对应项中。

被指抄袭的 IBM 论文题为「TableFormer: Table Structure Understanding with Transformers(TableFormer:用 Transformer 理解表结构)」,上传 arXiv 的时间是 2022 年 3 月份,提交给 CVPR 的时间未知。

论文链接:https://arxiv.org/pdf/2203.01017.pdf

在这篇论文中,IBM 的研究人员提出了一种新的表结构识别模型,它从两个方面改进了最新的端到端深度学习模型(即来自 PubTabNet 的 encoder-dual-decoder)。首先,他们引入了一种新的目标检测解码器用于表格单元格。通过这种方式,他们可以直接从 PDF 源中获取编程式 PDF 的表格单元格内容,从而避免了定制 OCR 解码器的训练。这种架构上的改变带来了更精确的表格内容提取。其次,他们将 LSTM 解码器替换为基于 transformer 的解码器。

Qi 表示,IBM 的这篇论文剽窃了他们的方法论、预处理、后处理、可视效果、推理、系统级解决方案、代码、预训练模型等内容,但「为了不被抓住」,他们没有引用 Qi 等人的论文。

接下来,Qi 用十几张图展示了他认为 IBM 存在抄袭的地方。

Qi 展示的疑似抄袭点 1:方法论。他认为,IBM 的研究者抄袭了他们的想法,并重写了「贡献」部分,而且根据他们的图重新画了结构图。

Qi 展示的疑似抄袭点 2:预处理。

Qi 展示的疑似抄袭点 3:后处理。

Qi 展示的疑似抄袭点 4:推理加速方法

Qi 展示的疑似抄袭点 5:技巧。

Qi 展示的疑似抄袭点 6:文本行检测和文本行识别。

Qi 展示的疑似抄袭点 7:系统级解决方案。

Qi 展示的疑似抄袭点 8:可视效果。

Qi 展示的疑似抄袭点 9:误导读者。

在看了 Qi 给出的示例后,有人认为这些都是非常有力的证据,IBM 团队很难证明自己的论文是原创的,Qi 应该向 CVPR 程序委员会投诉。

不过,也有人认为,这些证据不够有力:「两个小组研究的是同一个问题,使用的是相同的公开数据,他们的解决方案也有相似之处。但这并不意味着一方照搬另一方。例如「疑似抄袭点 1」中所展示的内容就不是那么接近」。

目前,我们还没有在帖子下方看到 IBM 论文作者的回应。

不过,值得一提的是,这并不是今年 CVPR 曝出的唯一一件疑似抄袭事件。几天前,一位网友在 YouTube 上爆料说,首尔大学的一篇论文抄袭了十几篇其他论文,目前该论文作者已经出来道歉并撤稿。

或许,顶会论文在查重上面需要多下点功夫了。

参考链接:https://www.reddit.com/r/MachineLearning/comments/vlpnuw/d_ibm_zurich_research_plagiarised_our_paper_and/

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 「他们并不是照抄文本,而是剽窃想法。」 转自《机器之心》 01 概述 昨天,有人在 reddit 上发帖称,IBM 苏黎世研究中心剽窃了自己的论文,而且还被 CVPR 2022 接收了。 这位发帖者写道: 我叫 Xianbiao Qi,是一位有十多年研究经验的计算机视觉研究者。我写这个博客是为了投诉一个严重的案例:IBM 苏黎世研究
计算机视觉研究院
2022/06/29
5850
又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
美国抄中国算借鉴?中国团队「CVPR剽窃案」控诉无果,IBM被判无罪
---- 新智元报道   编辑:好困 Aeneas 【新智元导读】此前,IBM被指巧妙地「借鉴」了中国团队研究成果的CVPR中稿论文,近日,IEEE定案——不构成抄袭。 窃idea不算偷?好家伙,真是从未见过如此厚颜无耻之人。 今年6月,曝出了一个大瓜:来自中国的研究团队发现,自己去年参加ICDAR竞赛的idea,竟然被IBM重新包装了一番,拿去投中了今年的CVPR。 随后,中国团队列出详实证据,举报IBM苏黎世研究院抄袭。接着,IBM发文坚称自己就是没抄。 近日,IEEE驳回了抄袭指控,判IBM「无
新智元
2022/08/26
3580
美国抄中国算借鉴?中国团队「CVPR剽窃案」控诉无果,IBM被判无罪
CVPR再度上演抄袭大戏!IBM中稿论文被指照搬自己承办竞赛第二名的idea
---- 新智元报道   编辑:拉燕 好困 【新智元导读】CVPR再曝抄袭门!这次是「大厂直抄,很会包装」。IBM,在?来解释解释? 一波未平,一波又起,CVPR 2022又被曝出论文抄袭! 这两天,来自中国的研究团队发现,自己去年参加ICDAR竞赛的idea,竟然被IBM拿去投中了今年的CVPR。 而这件事最讽刺的一点在于,ICDAR 2021正是由IBM自己承办的。 目前,作者已经将相关举证信息发给了CVPR的Program Chairs。 这件事的热度还在发酵。Reddit上的讨论热度即将破千
新智元
2022/06/29
3460
CVPR再度上演抄袭大戏!IBM中稿论文被指照搬自己承办竞赛第二名的idea
重磅开源!平安产险提出TableMASTER:表格识别大师
在4月份结束的 ICDAR2021 科学文献解析表格Table2HTML 赛道,平安财产保险视觉计算团队基于文本识别算法MASTER,提出了适用于表格识别的TableMASTER算法,并取得了该赛道的亚军。目前,作者团队基于开源工具箱mmocr,复现了该解决方案,代码已开源!
Amusi
2021/08/10
3.2K0
重磅开源!平安产险提出TableMASTER:表格识别大师
韩国AI团队抄袭震动学界!1个导师带51个学生,还是抄袭惯犯
杨净 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 今年CVPR,着实有点魔幻了! 先是韩国首尔大学AI团队的Oral,即前4%的优秀论文,被曝出涉嫌抄袭10篇论文。有的地方,连一个单词都没有变。 事发当日即登上韩国头条,国内外网友震惊:搞到CVPR上也太行了吧。 更多人爆料,这个团队抄袭已经不止一次,基本操作了属于是。 结果这一波还未结束,另一波又开始了。 IBM发表在CVPR上的论文TableFormer被指抄袭国内2021年发表的一篇文章。 爆料指出,IBM论文剽窃了他们的方法,包括预处理
量子位
2022/06/29
3780
韩国AI团队抄袭震动学界!1个导师带51个学生,还是抄袭惯犯
2022年谷歌学术指标发布,影响力前5名中4席为AI/ML顶会;IBM研究团队涉嫌抄袭中国研究者思路;通信顶会“时间检验奖”发布
2022年“MIT科技评论35岁以下科技创新35人”入选名单公布 6月28日,“MIT科技评论35岁以下科技创新35人”榜单公布。 在人工智能与机器人领域,吴恩达的学生Sharon Zhou成为今年该方向入选的唯一华人学者。据介绍,她今年29岁,是斯坦福大学的一名在读博士生,主要研究生成模型。 此外,今年计算领域有两位出色的华人研究者入选,他们分别是来自深圳市九天睿芯科技有限公司的创始人与CEO刘洪杰,以及卡内基梅隆大学电子与计算工程系的助理教授Xu Zhang。均为34岁。 刘洪杰的本科为吉林大学电子科学
AI科技评论
2022/07/04
5220
2022年谷歌学术指标发布,影响力前5名中4席为AI/ML顶会;IBM研究团队涉嫌抄袭中国研究者思路;通信顶会“时间检验奖”发布
“一字不差”,韩国AI团队论文被曝抄袭,一文抄 10 篇!
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) “一字不差”、“抄袭”、“与 10 多篇论文有重复”......这两天,随着国际计算机视觉与模式识别会议(CVPR 2022)的落幕,这些字眼也充斥着 CVPR 2022 的一篇学术论文,热度居高不下。 根据 CVPR 大会介绍,本次会议共收到了来自全球 23389 名作者的 8161 篇投稿。其中大会接收了共计 2064 篇论文,接收率为 25.3%。在这些论文中,有 342 份被选为 Oral 论文(需要口头报告形式呈现论文),1721 份
区块链大本营
2022/06/29
5810
“一字不差”,韩国AI团队论文被曝抄袭,一文抄 10 篇!
Top Trending Libraries of 2021,PaddleOCR再开源8大前沿顶会论文模型!
熟悉深度学习的开发者对Papers with Code肯定不陌生,作为全球领先的开源机器学习资源平台,集成论文、代码、数据集等全方位资料。
用户1386409
2022/03/31
4110
Top Trending Libraries of 2021,PaddleOCR再开源8大前沿顶会论文模型!
硕士生一字不差抄袭顶会论文投稿,北理工:严重学术不端,留校察看
机器之心报道 编辑:泽南、小舟 「复制粘贴论文」事件很快有了处理结果,下一个问题是:NeurIPS 的未发表论文是怎么泄露出来的? 把一篇 NeurIPS 2020 的论文投稿换个作者名字发到 arXiv 上,这样直接的造假行为着实让人摸不着头脑。 前段时间,一篇标题为《 Label Assignment Distillation for Object Detection 》的论文被举报抄袭。其中,论文作者之一张某某是北京理工大学一名 2020 级硕士研究生。 涉嫌抄袭的论文,原链接:https://ar
机器之心
2023/03/29
1.2K0
硕士生一字不差抄袭顶会论文投稿,北理工:严重学术不端,留校察看
首发 | 旷视14篇CVPR 2019论文,都有哪些亮点?
回顾 CVPR 2018 ,旷视科技有 8 篇论文被收录,如高效的移动端卷积神经网络 ShuffleNet、语义分割的判别特征网络 DFN、优化解决人群密集遮挡问题的 RepLose、通过角点定位和区域分割优化场景文本检测的一种新型场景文本检测器、率先提出的可复原扭曲的文档图像等等。
AI科技大本营
2019/03/15
1.1K0
首发 | 旷视14篇CVPR 2019论文,都有哪些亮点?
OCR技术难点解读:数学公式检测与识别
文档解析中的数学表达式检测与识别(Mathematical Expression Detection and Recognition, MEDR)是自然语言处理和计算机视觉交叉领域的重要技术,目的在于从文档中定位并解析数学公式,将其转化为结构化表示(如LaTeX、MathML等)。
合合技术团队
2025/04/23
3700
OCR技术难点解读:数学公式检测与识别
ICDAR 2019表格识别论文与竞赛综述(上)
表格作为一种有效的数据组织与展现方法被广泛应用,也成为各类文档中常见的页面对象。随着文档数目的爆炸性增长,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,成为了一个亟待解决的问题。ICDAR是一个专注于文档分析与识别问题的国际学术会议,已经连续多届设置了表格识别专题。在今年的ICDAR 2019会议上,有不少研究者在表格检测与结构识别等领域做出了新的贡献,使其有了新的进展。本课题组梳理了该会议中有关表格识别的16篇论文,总结该领域当前的研究进展与挑战。同时,值得注意的是,该会议也举办了关于表格检测与结构识别的比赛,我们对参赛队伍使用的方法与结果进行了一些讨论。
AI算法与图像处理
2019/11/29
6.8K0
达观陈运文:OCR技术发展综述与达观数据的实践经验
光学字符识别OCR技术(Optical Character Recognition)是指从图像中自动提取文字信息的技术。这项技术横跨了人工智能里的两大领域:CV(计算机视觉)和NLP(自然语言处理),综合使用了这两大领域中的很多技术成果。
用户10103085
2022/10/12
1.1K0
达观陈运文:OCR技术发展综述与达观数据的实践经验
ICCV 2019 | 旷视研究院11篇接收论文抢先读
两年一度的国际计算机视觉大会 ICCV 2019 ( IEEE International Conference on Computer Vision) 将于 10 月 27 日 - 11 月 2 日在韩国首尔举行。近期,大会官方公布了最终的论文接收决定,旷视研究院共有 11 篇论文被收录,研究领域涵盖通用物体检测及数据集、文字检测与识别、半监督学习、分割算法、视频分析、影像处理、行人及车辆再识别、模型压缩、度量学习、强化学习、元学习等众多领域。本文把 11 篇论文汇在一起,逐篇做了亮点抢先解读。
AI科技评论
2019/08/01
9270
ICCV 2019 | 旷视研究院11篇接收论文抢先读
CVPR 2022放榜!2067篇论文被接收:提前传播真会被拒
机器之心报道 机器之心编辑部 你上榜了吗? 放榜了! 在短短几分钟,朋友圈已经被 CVPR 2022 论文接收结果公布的消息刷屏。 作为人工智能领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会,投稿量在去年 11 月临近 deadline 时迅速超过了一万——上届 CVPR 2021 的有效投稿数还「仅有」7500 篇。创新高的投稿数引发了审稿压力,截止 1 月 25 日,共有 6427 位审稿人给出了 25801 个评审意见,包括 2104 位紧急审稿人的 3066 个紧急评审意见。 今天
机器之心
2022/03/04
7650
商汤ICCV论文解读:自然场景下文字检测的几何归一化网络(GNNets)
今年的ICCV,商汤科技及联合实验室共有57篇论文入选ICCV 2019(包含11篇Oral),同时在Open Images、COCO、LVIS等13项重要竞赛中夺冠!
Amusi
2019/12/24
7640
常用的表格检测识别方法——表格结构识别方法 (下)
表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位置等。在当前的研究中,表格结构信息主要包括以下两类描述形式:1)单元格的列表(包含每个单元格的位置、单元格 的行列信息、单元格的内容);2)HTML代码或Latex代码(包含单元格的位置信息,有些也会包含单元格的内容)。
合合技术团队
2023/06/01
3.6K0
常用的表格检测识别方法——表格结构识别方法 (下)
一篇看懂 CVPR 2017 五大研究前沿
腾讯AI实验室
2017/08/03
5K2
一篇看懂 CVPR 2017 五大研究前沿
ICDAR 2019表格识别论文与竞赛综述(下)
在表格识别领域,数据集规模一直是一个有待解决的问题。此前在表格识别或版面分析领域中,规模较大的数据集包括Marmot和ICDAR2017 POD竞赛数据集,也仅仅包含数千张文档页面图像而已,这对于数据驱动的深度学习方法来说是不够的,导致训练出的模型并没有有足够说服力的泛化能力和鲁棒性。所以在最近的工作中,也有不少学者针对表格识别领域发布了一些数据集,此次ICDAR2019会议中也不例外。
AI算法与图像处理
2019/11/29
4.2K0
CVPR 2022 | 美团技术团队精选论文解读
总第519篇 2022年 第036篇 计算机视觉国际顶会CVPR 2022近日在美国新奥尔良召开,今年美团技术团队有多篇论文被CVPR 2022收录,这些论文涵盖了模型压缩、视频目标分割、3D视觉定位、图像描述、模型安全、跨模态视频内容检索等研究领域。 本文将对6篇精选的论文做简要的介绍(附下载链接),希望能对从事相关研究的同学有所帮助或启发。 Paper 01 | Compressing Models with Few Samples: Mimicking then Replacing Paper 02
美团技术团队
2022/06/27
1.1K0
CVPR 2022 | 美团技术团队精选论文解读
推荐阅读
又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
5850
美国抄中国算借鉴?中国团队「CVPR剽窃案」控诉无果,IBM被判无罪
3580
CVPR再度上演抄袭大戏!IBM中稿论文被指照搬自己承办竞赛第二名的idea
3460
重磅开源!平安产险提出TableMASTER:表格识别大师
3.2K0
韩国AI团队抄袭震动学界!1个导师带51个学生,还是抄袭惯犯
3780
2022年谷歌学术指标发布,影响力前5名中4席为AI/ML顶会;IBM研究团队涉嫌抄袭中国研究者思路;通信顶会“时间检验奖”发布
5220
“一字不差”,韩国AI团队论文被曝抄袭,一文抄 10 篇!
5810
Top Trending Libraries of 2021,PaddleOCR再开源8大前沿顶会论文模型!
4110
硕士生一字不差抄袭顶会论文投稿,北理工:严重学术不端,留校察看
1.2K0
首发 | 旷视14篇CVPR 2019论文,都有哪些亮点?
1.1K0
OCR技术难点解读:数学公式检测与识别
3700
ICDAR 2019表格识别论文与竞赛综述(上)
6.8K0
达观陈运文:OCR技术发展综述与达观数据的实践经验
1.1K0
ICCV 2019 | 旷视研究院11篇接收论文抢先读
9270
CVPR 2022放榜!2067篇论文被接收:提前传播真会被拒
7650
商汤ICCV论文解读:自然场景下文字检测的几何归一化网络(GNNets)
7640
常用的表格检测识别方法——表格结构识别方法 (下)
3.6K0
一篇看懂 CVPR 2017 五大研究前沿
5K2
ICDAR 2019表格识别论文与竞赛综述(下)
4.2K0
CVPR 2022 | 美团技术团队精选论文解读
1.1K0
相关推荐
又一篇CVPR 2022论文被指抄袭,平安保险研究者控诉IBM苏黎世团队
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档