Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >陈丹琦团队发布CharXiv数据集:重新定义图表理解的评估标准

陈丹琦团队发布CharXiv数据集:重新定义图表理解的评估标准

作者头像
zenRRan
发布于 2024-07-04 04:43:41
发布于 2024-07-04 04:43:41
3110
举报

论文:CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs 链接:https://arxiv.org/pdf/2406.18521 项目:https://charxiv.github.io

这篇文章的标题是《CharXiv: Charting Gaps in Realistic Chart Understanding in Multimodal LLMs》,由普林斯顿大学、威斯康星大学麦迪逊分校和香港大学的研究人员撰写。文章主要关注多模态大型语言模型(MLLMs)在理解和分析图表方面的能力和局限。

以下是对文章的简洁解读:

  1. 研究背景:在现实世界任务中,如分析科学论文或财务报告,图表理解对MLLMs至关重要。但现有的数据集通常关注过于简化和同质化的图表,以及基于模板的问题,这导致对模型进展的评估过于乐观。
  1. 现有问题:尽管一些开源模型在现有基准测试中表现优于专有模型,但研究表明,当图表或问题稍有变化时,性能可能下降高达34.5%。
  1. CharXiv数据集:文章提出了一个新的评估套件CharXiv,包含来自arXiv论文的2323个自然、具有挑战性和多样化的图表。CharXiv包含两种类型的问题:描述性问题(检查图表的基本元素)和推理问题(需要综合图表中的复杂视觉元素)。
  1. 数据质量:所有图表和问题都由人类专家挑选、策划和验证,确保了质量。
  2. 评估结果:研究结果显示,即使是最强的专有模型(如GPT-4o)和开源模型(如InternVL Chat V1.5)在图表理解能力上也存在显著差距,远落后于人类的表现。
  1. 研究意义:CharXiv旨在通过提供更现实和准确的评估,促进未来MLLMs在图表理解方面的研究。
  2. 实验设置:评估了13个开源模型和11个专有模型,发现开源和专有模型之间存在显著差异。
  3. 结论:文章指出,现有的基准测试设计缺陷导致了对图表理解能力的高估,并强调了开发新的评估工具如CharXiv的重要性。

文章还包括了详细的相关工作、实验结果、分析和结论部分,但由于篇幅限制,这里只提供了一个高层次的概述。

本文由kimi+人工共同完成。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
ComfyUI DynamiCrafter教程|颠覆AI视频生成!分分钟实现图转视频,细节也能完美调整
北大、腾讯 AI Lab 联合推出 AI 视频生成工具 DynamiCrafter:只需输入一张普通的静态图,加上几句文字引导,瞬间就能生成超级逼真的动态视频!基于 ComfyUI 的 DynamiCrafter 可以让用户通过改变节点随心所欲地实现不同功能,赋予用户更高的自由度和创作空间。
HyperAI超神经
2024/06/04
8600
ComfyUI DynamiCrafter教程|颠覆AI视频生成!分分钟实现图转视频,细节也能完美调整
AI绘画专栏之HAI起来~Stablediffusion|文生视频|Controlnet|SDXL|Comfyui插件
Sora、StableForge、StableCasecade、Stable3.0、SDXLLighting、PlaygroundV2.5,Stable webui1.8等
疯狂的KK
2024/03/12
3.4K1
AI绘画专栏之HAI起来~Stablediffusion|文生视频|Controlnet|SDXL|Comfyui插件
【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图
最近ikun幻术图特别火啊,在网上能找到各种各样的ikun姿势图片,这些图片都是AI绘制的,能和风景完美融合在一起,今天小卷就来教大家怎么做这种图片
卷福同学
2023/08/15
1.2K0
【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图
『ComfyUI』起步
Stable Diffusion WebUI 应该是大多数人第一次接触 SD 绘画的工具,这款工具简单易上手,但操作流程相对固定。如果你想拥有更自由的工作流,可以试试 ComfyUI。而且很多新的模型和功能在刚出现时 ComfyUI 的支持度都比较高,比如刚出的 Stable Diffusion 3 Medium,在现阶段也只支持 ComfyUI(注意本文发布的日期)。
德育处主任
2024/06/17
5860
『ComfyUI』起步
CloudStudio之ComfyUI上使用Wan2.1输出高质量视频
启动后默认监听8188端口,直接在空间地址例如https://xxx.ap-singapore.cloudstudio.work/修改成https://xxx--8188.ap-singapore.cloudstudio.work/即可打开项目网站。
CloudStudio
2025/03/13
8154
在线教程 | 轻松拿捏莫奈花园、宫崎骏漫画风格,用 ComfyUI InstantID 打造百变写真
ComfyUI InstantID 能够赋予用户极高的自由度与更丰富的创造空间,只需调整连接节点,就能实现个性化定制。
HyperAI超神经
2024/05/22
3890
在线教程 | 轻松拿捏莫奈花园、宫崎骏漫画风格,用 ComfyUI InstantID 打造百变写真
【零绘画基础程序员必学】AI绘画入门笔记03—初识ComfyUI+FlUX
前面介绍的SD的操作界面其实叫做 WebUI,这是SD的入门操作界面,它非常适合初学者快速上手。它的界面简洁,功能展示清晰,很适合用户理解SD的生图方式。
CS逍遥剑仙
2025/04/18
2260
【HAI要玩AI】DeepSeek R1助力AIGC生图 StableDiffusion Comfyui工作流电商实战一键部署
Hello大家好,好久不见,我是KK,欢迎来到本期深度解析,本期将带领大家全方位的体验AI在电商领域的助力效果,期间会体验到一键部署,DeepSeek R1满血版助力助力AIGC生图提示词,StableDiffusion在电商领域的实战样例,详细到知识点,工作流,部署,以及扩展,尽管腾讯混元Video等文生/图生视频模型展现了惊人的创造力,但本地部署的硬件门槛如20/30系显卡算力局限、AMD架构兼容性问题仍将大量开发者拒之门外。值得关注的是,在电商领域,​Stable Diffusion正通过云端协同、轻量化一键部署、可视化界面、Comfyui工作流等方案突破桎梏,在各行各业生根开花。
疯狂的KK
2025/03/11
9592
【HAI要玩AI】DeepSeek R1助力AIGC生图 StableDiffusion Comfyui工作流电商实战一键部署
ComfyUI 安装教程 1000张工作流分享 请收藏
最近SD的大更新比较少,所以最近转战到ComfyUI,从流程节点,到工作流搭建,使用ComfyUI实现webui的大部分功能,且节点的定义性很强,这就造就了ComfyUI的多样性,但是不得不承认,多节点之间的搭配,是否符合整个底层流程,通过一个工作流实现多节点插件的配合工作是比较复杂的,而ComfyUI不近支持GPU还支持CPU,大大降低了使用门槛,在显存占用方面明显低于webui,实际测试中,出图分辨率在2160*1260 下跑视频22S仍然不会爆显存,都在说比webui有更好的内存管理功能,但是我没有找到理论知识点证明这一点。
疯狂的KK
2024/01/12
7.2K1
ComfyUI 安装教程 1000张工作流分享 请收藏
内含教程丨最高可降低 16 倍成本,ComfyUI Stable Cascade 教程已上线,一键部署!
今年 2 月,Stability AI 开源了文生图模型 Stable Cascade。相比于 Stable Diffusion 1.5,Stable Cascade 可以降低 16 倍成本。
HyperAI超神经
2024/04/12
5000
内含教程丨最高可降低 16 倍成本,ComfyUI Stable Cascade 教程已上线,一键部署!
HAI:用AI圆了我的插画梦
记忆中的青春,总在追逐一些美的事情。今天晚上泡在健身房里、明天又买了把吉他学起了民谣。那一年被《千与千寻》、《你的名字》吹过的夏天,脑海里不断回放着新海诚、宫崎骏故事世界的每一帧画面。
叫我阿柒啊
2024/06/05
5022
HAI:用AI圆了我的插画梦
北大、腾讯等联合发布!DynamiCrafter:任意图像秒变动态视频,超高清无缝衔接
由北大、腾讯 AI Lab 强强联手推出的 DynamiCrafter 能够模拟真实世界的运动模式,处理包括风景、人物、动物、交通工具、雕塑等多种类型的静态图像,并结合文本指令控制物体细节运动,瞬间生成超逼真的动态视频!被广泛应用于文化教育、社交营销、娱乐媒体等领域。
HyperAI超神经
2024/06/04
4000
北大、腾讯等联合发布!DynamiCrafter:任意图像秒变动态视频,超高清无缝衔接
AIGC-基于EAS服务快速部署一个AI视频生成 精
AI视频生成已成为当前热门应用之一。目前市面上有许多开源视频生成大模型可供选择,它们在不同领域展现了各自独特的性能。与此同时,AIGC开源工具ComfyUI也迅速在市场上崭露头角。作为一个基于节点流程式的AIGC生成工具WebUI,ComfyUI将AIGC流程拆分成工作节点,实现了精准的工作流定制和可复现性。
七条猫
2024/08/08
1860
0成本!基于腾讯云Cloud Studio,打造属于自己的数字人口播系统,照片+音乐=自动开口,效果炸裂
原文链接:https://mp.weixin.qq.com/s/G39ZHVITRilKlXnKn3mkrA
CloudStudio
2025/03/17
4020
用ComfyUI的思路设计Agent工作流
过去几周,我一直在思考如何用自然语言来编写Agent工作流。起初我的思路是通过LLM从自然语言中提炼出可用于表达Workflow的DSL,再由DSL来驱动流程引擎。但是在实现过程中,我发现流程引擎的能力与DSL的匹配度其实很难把握,其中的根源在于DSL本身的设计,往往具有局限性。在使用了ComfyUI的工作流之后,我有了新想法,这篇文章就来聊一聊。
否子戈
2024/04/19
1.4K0
用ComfyUI的思路设计Agent工作流
ComfyUI 换脸工作流
市面上存在着众多琳琅满目的软件,它们虽各具特色,却也存在诸多局限性。例如,一些软件换脸效果不稳定容易出现失真或模糊现象;部分则设置了较高的收费门槛;还有些软件生成速度过慢。而现在,通过 ComfyUI 的工作流,我们不仅能够轻松实现高质量的换脸效果,还支持同时处理多张人脸,以及视频的合成处理。更为重要的是,可以根据实际需求灵活调整参数,实现定制化的工作流程。
球球的前端奶茶屋
2025/01/21
7930
ComfyUI 换脸工作流
推荐2024年个人经常使用3大类的AI工具,非常实用,值得上手收藏!
豆包 是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及AI绘画等功能,它可以回答各种问题并进行对话,支持网页 Web 平台,iOS 以及安卓移动端。
Python兴趣圈
2024/05/22
4.7K0
推荐2024年个人经常使用3大类的AI工具,非常实用,值得上手收藏!
AI绘画专栏之 终于来了!4步 webui使用Stableforge实现SVD文生视频
以前我们分享的SVD不管是文生视频还是长视频还是图生视频,都是在Comfyui中实现的,但是大多数的用户还是在webui中使用的,那么forge它来了,A111点赞的实现SVD的整合方式。
疯狂的KK
2024/02/20
2.5K0
AI绘画专栏之 终于来了!4步 webui使用Stableforge实现SVD文生视频
每帧纵享丝滑——ToDesk云电脑、网易云游戏、无影云评测分析及ComfyUI部署
随着数字化浪潮席卷而来,人们对计算能力和资源的需求愈发迫切。有时,我们想要尽情享受高配置的3A游戏,却发现本地电脑的性能跟不上;有时,信心满满报名了热门的AIGC课程,却发现设备缺少必要的GPU支持;有时,我们想要剪辑和渲染复杂的视频,本地电脑却不具备高速的处理器、足够的内存、高效的显卡和一款支持多种输出格式和编码方式的渲染软件(如CAD/SolidWorks/Revit等);又或者,承接了程序外包项目,但启动资金有限,无法租赁场地和购买设备等等,各种软硬件与成本预算受限的情况。
中杯可乐多加冰
2024/04/18
2.1K0
每帧纵享丝滑——ToDesk云电脑、网易云游戏、无影云评测分析及ComfyUI部署
推荐8款超实用的ComfyUI绘画插件,帮助我们的AI绘画质量和效率提升几个档次!
大家在使用SD绘画过程中,想必见识到了插件的强大功能,本身纯净版的SD界面是相对简洁的,但是搭配了各种插件后,界面标签栏会增加很多,相应的功能也增加了。
Python兴趣圈
2024/04/13
4.3K0
推荐8款超实用的ComfyUI绘画插件,帮助我们的AI绘画质量和效率提升几个档次!
推荐阅读
ComfyUI DynamiCrafter教程|颠覆AI视频生成!分分钟实现图转视频,细节也能完美调整
8600
AI绘画专栏之HAI起来~Stablediffusion|文生视频|Controlnet|SDXL|Comfyui插件
3.4K1
【奶奶看了都会】2分钟学会制作最近特火的ikun幻术图
1.2K0
『ComfyUI』起步
5860
CloudStudio之ComfyUI上使用Wan2.1输出高质量视频
8154
在线教程 | 轻松拿捏莫奈花园、宫崎骏漫画风格,用 ComfyUI InstantID 打造百变写真
3890
【零绘画基础程序员必学】AI绘画入门笔记03—初识ComfyUI+FlUX
2260
【HAI要玩AI】DeepSeek R1助力AIGC生图 StableDiffusion Comfyui工作流电商实战一键部署
9592
ComfyUI 安装教程 1000张工作流分享 请收藏
7.2K1
内含教程丨最高可降低 16 倍成本,ComfyUI Stable Cascade 教程已上线,一键部署!
5000
HAI:用AI圆了我的插画梦
5022
北大、腾讯等联合发布!DynamiCrafter:任意图像秒变动态视频,超高清无缝衔接
4000
AIGC-基于EAS服务快速部署一个AI视频生成 精
1860
0成本!基于腾讯云Cloud Studio,打造属于自己的数字人口播系统,照片+音乐=自动开口,效果炸裂
4020
用ComfyUI的思路设计Agent工作流
1.4K0
ComfyUI 换脸工作流
7930
推荐2024年个人经常使用3大类的AI工具,非常实用,值得上手收藏!
4.7K0
AI绘画专栏之 终于来了!4步 webui使用Stableforge实现SVD文生视频
2.5K0
每帧纵享丝滑——ToDesk云电脑、网易云游戏、无影云评测分析及ComfyUI部署
2.1K0
推荐8款超实用的ComfyUI绘画插件,帮助我们的AI绘画质量和效率提升几个档次!
4.3K0
相关推荐
ComfyUI DynamiCrafter教程|颠覆AI视频生成!分分钟实现图转视频,细节也能完美调整
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档