腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(5464)
视频
沙龙
2
回答
从PDF中提取文本,并将提取的文本保存在
Excel
或其他地方
、
我想要一个简单的方法,从pdf中提取文本,并将文本保存到
Excel
中。 谢谢!
浏览 16
提问于2020-07-13
得票数 0
2
回答
黑名单字符不会被Tesseract
OCR
忽略
、
、
但我希望
OCR
忽略数字字符。_tesseract->SetVariable("tessedit_char_blacklist", "0123456789");如上文所示,
OCR
将12
转
换为
fl,这是我不想要的。我希望12被
OCR
忽略。
浏览 2
提问于2013-03-04
得票数 3
回答已采纳
2
回答
为什么我用魔杖从pdf中提取图像jpg,它会在文本上变成黑色背景?
、
、
、
、
我需要将它们转
换为
jpg图像,使它们可用于
OCR
,但当我转换其中的一些,魔杖
转
我的jpg在那里有一个黑色的背景文本。我看到这是一个关于空间颜色的常见问题。这似乎发生在word转
换为
pdf文件的文件中,其中空间颜色变成了CMYK。Tesseract
OCR
仅接受空间颜色RGB。我已经写了一个可以转换的python脚本,但我想解决这个问题。你能帮我一下吗?已将pdf转
换为
jpg
浏览 51
提问于2019-04-22
得票数 1
回答已采纳
5
回答
是否有
OCR
无法识别的字体?
我正在试着写一个只能被人读懂的
文档
。无法复制
文档
内容。为此,我将其页面转
换为
图片,并将其添加回PDF文件。主要的问题是,任何
OCR
程序都可以恢复整个书面文本,特别是页面将是清晰的(而不是扫描的书),这将提高
OCR
的准确性。提前谢谢你。
浏览 3
提问于2012-11-13
得票数 4
回答已采纳
2
回答
将数字转
换为
excel
中的下一个0.5
、
请帮助将数字转
换为
excel
中的下一个0.5。示例:1.499
转
换为
1.54.012
转
换为
4.50.12
转
换为
0.5即转
换为
next 0.5。
浏览 2
提问于2014-03-09
得票数 0
1
回答
有没有从图片中提取表格数据的api?
、
、
我正在开发一个应用程序,处理包含表格的
文档
和图像,并将其转
换为
excel
格式。我想集成“插入图片中的数据”功能,就像this一样,有没有可以用来做这件事的应用程序接口?谢谢
浏览 14
提问于2021-01-31
得票数 0
1
回答
如何将jpg文件目录转
换为
以文件名为书签的pdf?
、
、
如何将它们转
换为
一个将文件名作为书签的pdf文件? (我最终也想加入
ocr
。如前所述,我们可以使用.jpg将.pdf文件转
换为
img2pdf .jp --output combined.pdf,然后可以使用ocrmypdf combined.pdf combined_
ocr
.pdf添加
ocr
。我的问题主要是如何确保pdf文件有书签(由文件名创建),以便
文档
易于浏览。
浏览 0
提问于2021-09-23
得票数 0
1
回答
使用Ghostscript将扫描的PDF转
换为
纯文本
、
、
我知道有一种方法可以使用将scannedPDF
文档
转
换为
OCR
'd PDF
文档
,使用以下命令:看起来我遗漏了一些与用法相关的东西。请在此处更正我或提供您的宝贵建议,以转
换为
简单的文本,而不是PDF
浏览 1
提问于2021-03-04
得票数 0
1
回答
带有文件插入的汉字
OCR
我试图
OCR
一个文件插入到谷歌驱动器。正在插入的图像包含汉字。当OCRing时,图像会像往常一样转
换为
Google,但是没有一个文本被提取出来。根据
文档
,您应该使用"ocrLanguage“,其值为ISO639-1代码。但是没有提到支持哪种语言。我试过使用"“,但也没有
OCR
。根据docs,这个参数只是一个提示,如果<em
浏览 3
提问于2014-07-25
得票数 1
2
回答
在Android上使用Google Docs
OCR
做其他事情
、
我正在考虑用我的android手机从
文档
中捕获一些文本,并在android上寻找一个理想的
OCR
应用程序。我今天碰巧看到Google推出了
OCR
,用于扫描可以在Google Docs中编辑的
文档
。我想知道我是否可以使用
OCR
来做一些事情,而不是将
文档
转
换为
Google Docs -比如,拍摄证书的照片,捕捉候选人的姓名和出生日期,或者拍摄车牌照片,并能够以文本形式获得可以存储的信息。如果有人知道如何使用谷歌的
OCR
在Android上实现这一点,那将是一
浏览 1
提问于2011-04-28
得票数 4
1
回答
在IXLWorksheet中传递值将字符串转
换为
日期
、
我有一个带有IXLWorksheet的
excel
生成器。当我试图将十进制值传递给
excel
工作表时,它会将这些数字3.10、3.11和3.12
转
换为
日期。我真的不知道为什么会发生这种事,有人知道吗?打印示例:
浏览 4
提问于2020-10-28
得票数 0
回答已采纳
1
回答
从PDF中获取树的文件(最好使用Python)
、
、
、
、
我想制作一系列文件,其中包含了这个PDF ()中的树。文件的名称将是左边对应的树号(t0、t1等)。或者,我获得PDF的网站()有另一种形式的树(例如: t27 S##1#l# NP#0#2#l#s NP#0#2#r#s VP##3#l# V##4#l#h V##4
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
1
回答
如何将所有图像转
换为
Word
文档
中的文本?
、
这些图片中有文字,我找不到一个工具,可以很容易地做到这一点,最好没有任何安装。
浏览 0
提问于2011-02-17
得票数 0
1
回答
textract有没有办法将pdf图像渲染到
excel
数据表中?
这意味着,我不能从中复制和粘贴值,并且
OCR
不可用。有没有一种方法可以使用textract (或其他服务)将数据表转
换为
excel
?
浏览 18
提问于2020-09-17
得票数 1
1
回答
如何在
Excel
中按日期
转
置数据
、
我在csv文件中有要
转
置的数据 初始数据如下所示: ? 我想像这样
转
置数据: ? 有没有办法在
excel
中做到这一点?我在
excel
中尝试了常规的
转
置,但日期会转
换为
列而不是行。
浏览 23
提问于2020-05-01
得票数 0
回答已采纳
1
回答
Ms Access -将字符串字段转
换为
日期字段有问题
、
将文件从
Excel
导入到通过VBA访问之后,我将尝试使用以下方法将包含日期的字符串字段更改为日期字段将
Excel
中的字符串29/08/2013
转
换为
日期08/29/2013,但我理解它的
浏览 6
提问于2013-11-19
得票数 0
回答已采纳
1
回答
和OpenCV
、
、
、
我正在附加一个简化的 我有一个模板图像的所有类型的对象和“转弯”,我也有
excel
电子表格模板。目标是:我必须创建
excel
电子表格(每个图像一个),其中包含对象的距离(这是奇怪的0+000内容)、对象的名称和/或道路的类型,但我是编程的初学者,我从未使用过OpenCV技术,所以我想征求一些建议。
浏览 2
提问于2022-07-06
得票数 1
2
回答
袖珍式收据扫描器
、
但我发现这里有一些主要的缺点:很难找到正确的角度(尤其是当你一整天都在前进的时候),默认有损压缩格式(为图片设计)会给
OCR
浏览 0
提问于2015-09-13
得票数 9
回答已采纳
1
回答
我正在构建一个用于后处理
OCR
文本的神经网络。卷积层是一个好的选择吗?
、
、
从收据、发票等典型
文档
中,利用
OCR
和模板提取相关信息。稍后,人员必须在视觉上验证信息是否正确识别,或者在需要的地方手动调整。我的任务是构建一个执行验证的模型。
浏览 12
提问于2021-01-17
得票数 0
1
回答
将扫描的pdf转
换为
R中可搜索的pdf
、
我有一个pdf,大约50页扫描表。我需要最终把它刮到R中,这样我就可以清理数据并将其导出为.csv。我有使用tabulizer抓取可读的pdfs的经验,但我以前从未真正使用过扫描pdfs,tabulizer无法读取它们。有没有一种方法可以将扫描的pdf转换成可读的pdf,这样我就可以在tabulizer中抓取它了?还是另一种将扫描的pdfs抓取到表中的方法?
浏览 5
提问于2022-11-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
PDF文档可以转Excel吗?
OCR图片转Excel表格:没结构化的弊端
Excel转PDF怎么转?推荐几种文档格式转换方法
Excel转Word,Excel导出Word,利用Excel表批量生成Word文档
图片转excel表格,人工处理与OCR方案的优劣对比
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券