前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用kimichat批量识别出图片版PDF文件中的文字内容

用kimichat批量识别出图片版PDF文件中的文字内容

作者头像
AIGC部落
发布2024-06-24 18:18:20
640
发布2024-06-24 18:18:20
举报
文章被收录于专栏:Dance with GenAIDance with GenAI

图片版的PDF文件,怎么才能借助AI工具来提取其中全部的文字内容呢?

第一步:将PDF文件转换成图片格式

具体方法参见文章:《零代码编程:用kimichat将图片版PDF自动批量分割成多个图片》

第二步:识别图片中的文字

将第一步pdf转换成的图片,上传到kimichat

注意:kimichat目前上传图片一次最多50张图片,单个大小不超过100M

上传完成后,kimichat会进行解析。

部分图片会提示:未提取到文字或者解析失败

点击这些解析失败图片的右上角红色X,把这些无法解析的图片删除掉

然后回车,就全部识别出来到了。但是,识别的顺序不是按照文件标题名来的,有些乱,可以让kimichat调整下:

请按照图片标题顺序排列

Kimichat最终的输出结果:

当然,根据您提供的图片标题顺序,这里是整理后的文字内容:

  1. **page_5.png:** - I'll Be α - COWBOY - Anita Bijsterbosch - Clavis - NEWYORK
  2. **page_6.png:** - “Mommy, there's a party at school - tomorrow, and we get to wear - costumes!" Sammy says.
  3. **page_8.png:** - "I think I'll be - a cowboy. - lasso"
  4. **page_9.png:** - cowboyhat - Shirt ......... - vest - .... - Fringed pants - cowboy boots - spurs
  5. **page_10.png:** - "Yee-Haw!"
  6. **page_12.png:** - "Or wait, I'll go as - a firefighter." - dragon - walkie-talkie - Fire engine - Flashlight
  7. **page_13.png:** - helmet - Firefighter suit - gloves - Firefighter boots
  8. **page_15.png:** - "Fire!"
  9. **page_16.png:** - "Hmm, perhaps - I'll be a pirate." - parrot - JollyRoger - treasure map - treasure chest - spyglass
  10. **page_17.png:** - bandana - eyepatch - striped T-shirt - ...... - belt - trousers - buccaneer - boots
  11. **page_19.png:** - Land - ho!"
  12. **page_20.png:** - “Or I could - gc - as a knight. - castle - horse - cuddly toy - Feather - dragon - Sword”
  13. **page_21.png:** - helmet - armor - shield - gauntlet - boots
  14. **page_23.png:** - Tan-tan-tara!
  15. **page_24.png:** - "I could be - a magician... - wand"
  16. **page_25.png:** - magic hat - OD - boots
  17. **page_26.png:** - "+"
  18. **page_27.png:** - Abracadabra!
  19. **page_28.png:** - “Or maybe - I should - just go - as myself?”
  20. **page_29.png:**

- T-shirt

- overalls

- boots

这些文字内容似乎是从一本关于职业和角色扮演的儿童书中提取的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-04-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Dance with GenAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云微搭低代码
微搭低代码是一个高性能的低代码开发平台,用户可通过拖拽式开发,可视化配置构建 PC Web、H5 和小程序应用。 支持打通企业内部数据,轻松实现企业微信管理、工作流、消息推送、用户权限等能力,实现企业内部系统管理。 连接微信生态,和微信支付、腾讯会议,腾讯文档等腾讯 SaaS 产品深度打通,支持原生小程序,助力企业内外部运营协同和营销管理。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档