对于广大强迫症患者来说,比较“可怕”的场景莫过于录入信息时对方发来一张张截图;更可怕的情况是截图是一张张表格;地狱级别的情况是表格不但数据海量,格式还多而复杂,使用简单的文字识别应用结果导出一页乱码,甚至出现单元格合并、跨行、跨列、文字重叠错位等情况......简直要逼“死”强迫症。
这时候就轮到强迫症福音——表格识别V3版本上场了。
表格识别V3是腾讯云AI在表格识别V2基础上针对多种难例场景推出的全新升级版本,相比表格识别V2,表格识别V3覆盖场景更加广泛,对表格难例场景的识别效果均优于表格识别V2。
目前表格识别V3在4个方面有着极大优势:
1 | 识别准确率基于腾讯优图实验室自研新一代生成式表格结构还原算法,平均技术指标达到96%以上,表格识别精度高。 |
---|---|
2 | 场景覆盖度支持各种类型的复杂表格结构还原,包括有线表格、无线表格、嵌套表格等,具有较强的通用性,并且通过亿级样本的海量预训练数据来提高模型的泛化能力和准确性。 |
3 | 抗干扰性在背景干扰、线不清晰、线密集、扭曲畸变等多种难例场景下,基于生成式的表格线方案鲁棒性好、抗干扰能力强。 |
---|---|
4 | 自动化程度能够自动地将PDF、图片中的表格内容转化为Excel数据,大大减少了人工处理的工作量和时间成本。 |
其实在此之前,腾讯云文字识别就推出了表格识别V2,支持中英文图片/PDF常规表格、无线表格、多表格的检测和识别,返回每个单元格的文字内容,支持旋转的表格图片识别,且支持将识别结果保存为Excel格式。
可是,仅仅这些还不足以满足人们的复杂需求。金融、医疗、物流、电商等行业由于业务繁杂,大量数据需求不断催生,导致数据格式也更复杂。企业在做数字化建设与管理时,单纯依靠人工录入难度大、效率低;此外,除了常见的有线表格,还存在包含多级嵌套关系的复杂表格类型,这些复杂类型也提升了人工录入的难度。
口说无凭,这里我们用同一张原图,分别用表格识别V2、表格识别V3测试表格还原重建效果。
难例场景 | 原图 | 表格识别V3 | 表格识别V2 |
---|---|---|---|
背景干扰 | |||
表格线不清晰 | |||
表格线密集 | |||
无线表格 | |||
表格嵌套 |
通过对比测试我们可以发现,表格识别V2面对难例场景会出现以下等问题:
●表格线漏识别
●表格线过度分割
●表格行列拆分错误
而表格识别V3能有效解决此类问题,并且相较V2表现更加亮眼:
●还原重建指标达到95%以上
●字符识别准确率达到96%以上
●表现效果更为突出
表格识别V2已难以支撑人们的需求,表格识别V3则应运而生;不过这远远不是AI技术的尽头。表格识别只是实现业务基础的一步,随着AI技术的创新,从表格智能识别到表格智能处理,乃至智能交互控制也会涌现出不少生产力工具。
OCR表格识别虽然只解决了“小而痛”的问题,却也能成就“小而美”的垂直应用。不难看出,从小工具的实用到大系统的集成,OCR技术正逐渐“下沉”为一项基本的能力,为上层不同的业务应用提供底层技术支撑,延伸出丰富的功能服务。
“科技改变生活”并不只是一句空虚的口号,因为我们在切实享受AI技术发展带来的便利。让我们一起期待未来生活能随着AI技术的发展变得更加美好。
目前腾讯云AI表格识别已推出相关服务,感兴趣的客户可通过点击阅读原文联系我们。
腾讯云智能生态计划
腾讯云智能,依托腾讯优图实验室、腾讯AILab、腾讯多媒体实验室、微信智聆、微信智言等腾讯顶级实验室的产品和技术能力,持续引入生态合作伙伴,共建智能生态。通过授权认证、商机共享、技术共建、平台助力、品牌升级、标杆打造等合作形式,帮助合作伙伴和客户高效打造针对性的解决方案,助力各行各业的数字化和智能化转型。
END
更多AI资讯,你可能感兴趣
▼