腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何使用
PYTHON
批量处理
PDF
数据,再导出PNG?
、
本地数据迁移至云端工作系统,需要将大量的
PDF
文本中的价格信息抹除,再导出成PNG格式的图片,如何实现
浏览 255
提问于2022-05-24
2
回答
Python
复制或移动名称位于文本文件列表中的文件
、
该文本文件包含一个类似以下内容的列表:C:\dir5\dir6\file2.txt...more文件名 File "C:/Documents and S
浏览 2
提问于2014-02-24
得票数 4
1
回答
如何
读取
亚洲语言(中文、日文、泰文等)的
PDF
文件并将字符串存储在
python
中。
、
、
、
、
我使用PyPDF2
读取
python
中的
PDF
文件。虽然它适用于英语和欧洲语言的语言(英
文字
母),但图书馆无法阅读亚洲语言,如日语和汉语。当我从
PDF
中复制文本并将其粘贴到笔记本上时,字符就会变成一些随机格式的文本(可能是以不同的编码方式)。def convert_
pdf
_to_text(filename):
pdf
= PyPDF2.PdfFileReader(open(filename, "rb&quo
浏览 1
提问于2018-06-22
得票数 4
回答已采纳
1
回答
将置乱的
PDF
字符重映射为可读的文本
、
、
、
我确实有一个问题,因为cups-
PDF
创建
PDF
文档,其中字符映射到奇怪的符号[在Ubuntu 14.04和16.04}。我认为这是某种unicode,即使
Python
告诉我它的字符串类型。type(object)
python
返回"string" 如果我从
PDF
中获取文本,通过鼠标复制粘贴,或者通过
Python
模块,或者通过
Python
模块。因此,它的真实,
PDF
有破坏文本信息,这是正确的
PDF
文档本身。我不知道
浏览 1
提问于2017-04-18
得票数 0
回答已采纳
4
回答
我是否有办法在不破坏
python
代码缩进的情况下排列多个
文字
行来显示?
我想安排
文字
行为容易的代码
读取
和容易输出
读取
。有关详细信息,请参阅下列代码。if failed:Failed.\n\ reason:...要安排输出,即在行首没有空格,
python
代码中的
文字
行从行首开始。但是,它破坏了
python
代码缩进。我是否有办法在不破坏
python
代码缩进的情况下排列多个
文字
行来显示?非常感谢。
浏览 0
提问于2017-08-21
得票数 1
回答已采纳
2
回答
我可以使用message将
PDF
或MS Word文档内容作为XML流吗?
、
、
、
我正在尝试将word文档和
PDF
的内容发送到Apache OpenNLP。我想知道是否可以使用ActiveMQ
读取
MS单词,以便触发一个进程到Apache来处理流。欢迎您建议将
PDF
文件或ActiveMQ以外的其他
文字
进行流。
浏览 9
提问于2021-10-03
得票数 0
回答已采纳
2
回答
我们可以使用lua脚本提取
pdf
页面吗?
、
我们的应用程序是接收基于150页的
PDF
文件从业务线,我想从这个
pdf
文件中提取页面使用lua脚本。谢谢
浏览 1
提问于2011-07-25
得票数 1
回答已采纳
2
回答
如何使用Java程序
读取
文件名中的非英语字符
我试图阅读我的发件箱中的邮件,它通常包含一个附加的
pdf
文件。如果
pdf
文件名包含英
文字
符,下面的功能可以正常工作。但是,如果文件名包含任何非英语字符(例如,filename1(chinesecharacter).
pdf
),则我的函数无法
读取
它。有人能告诉我我的职能需要做什么改变吗?
浏览 5
提问于2011-01-17
得票数 1
1
回答
如何在Julia中将utf8代码转换为字符?
、
、
我正在从一个使用us-utf8编码的纯文本文件中
读取
字符串,在
读取
内容后,我想提取包含中
文字
符的文件名,并且中
文字
符以其utf8代码存储在文件中,例如:\x6532\x6320.
pdf
等。当然,我需要将其更改为\u而不是\x 但我感到困惑,因为在julia控制台中,当println( "\u6532\u6320.
pdf
“)或其他内容时,很容易获得相应的中
文字
符,但如果从文件中
读取
字符串,它只能显示为”\u6532\u6320.
pdf<
浏览 21
提问于2021-07-10
得票数 2
回答已采纳
2
回答
用
python
打开不带文本的
pdf
、
我希望为Django视图打开一个
PDF
,但是我的
PDF
没有文本,
python
返回给我一个空白
PDF
。在每一页上,这是对一个页面的扫描: with open(path) as
pdf
: response = HttpResponse(
pdf
.read(),content_type='application/
浏览 1
提问于2018-09-17
得票数 0
回答已采纳
1
回答
Python
读取
pdf
文件
、
如何使用jupyter实验室从
pdf
文件中
读取
和提取表格? 一个典型的
pdf
文件与文本之间的
文字
字幕和表格。我需要编码来提取特定标题下的表格,并清理一些不需要的文本,比如页码。
浏览 3
提问于2022-09-19
得票数 -1
1
回答
更快地替代PDFcrop
、
、
、
背景问题是,PDFcrop非常慢。对于一个15页的文档,使用以下语法处理需要17分钟。pdfcrop --margins "-1 0 -1 -2" Raw.
pdf
Cropped.
pdf
&> /dev/null 不用说,这是不可接受的,因为事实上,我将做一个类似的过程,以完全相同的方式生成的
PDF
文件,将超过150页。我使用了下面的命令,它从我
浏览 0
提问于2016-01-21
得票数 5
3
回答
不创建文件将
pdf
转换为文本
、
、
我想从一个网站下载
pdf
文件和
文字
工作。但是,我不想创建一个
pdf
文件,然后将其转换为文本。我使用
python
请求。有什么方法可以直接在下面的代码之后得到文本吗?
浏览 1
提问于2017-11-12
得票数 0
回答已采纳
1
回答
我如何阅读
python
的
pdf
?
、
、
、
我如何在
python
中
读取
pdf
?我知道一种将它转换为文本的方法,但是我想直接从
pdf
中
读取
内容。 有人能解释一下
python
中哪个模块最适合
pdf
提取吗?
浏览 2
提问于2017-08-21
得票数 45
1
回答
在组织模式代码块导出中显示纠缠的文件名
、
、
我正在Emacs组织模式下进行
文字
编程。当我将Latex导出到
pdf
时,我希望每个代码块都显示代码纠缠到的文件的名称。我在中找不到合适的头参数。这是我的组织文件:#+BEGIN_SRC
python
:tangle pythontest.py#+END_SRC这是我的.emacs: 'org-babel-load-languages '(
浏览 5
提问于2016-08-10
得票数 3
1
回答
用
Python
和pyPDF提取前两行
PDF
、
、
我使用
python
2.7和pyPDF从
PDF
文件中获取标题元信息。不幸的是,并非所有
PDF
都有元信息。我现在要做的是从
PDF
中抓取前两行
文字
。如何使用我现在拥有的代码来用pyPDF捕获前两行呢?= "
pdf
": continue
浏览 3
提问于2016-09-29
得票数 1
回答已采纳
2
回答
我可以让
python
不给出路径,而是通过打开计算机上的文件来
读取
pdf
吗?
、
、
我对
python
非常陌生,似乎每个教程都提到在
python
中打开和
读取
pdf
时需要路径。 我想要读的
pdf
可以定位在不同的文件夹和有不同的名字,我想避免依赖用户的输入。相反,我希望能在计算机上打开Acrobat中的
pdf
,并编写
python
代码来
读取
当前打开的
pdf
文件。这个是可能的吗?
浏览 3
提问于2021-02-18
得票数 0
回答已采纳
3
回答
找不到bash grep文件
、
我希望应用一些基于grep搜索的命令,我执行了grep -l "If you wish to distribute" *.
pdf
,并且看到了我想要处理的文件,但是使用以下bash脚本,这些文件不会被处理/bin/bash -x grep -l "$text1" *.
pdf<
浏览 1
提问于2012-10-29
得票数 1
3
回答
从
pdf
文件中获取数据
、
我有一张
pdf
文件中的表格。有x,y,z列。我只想要x列。有可能使用
python
吗?如果是,怎么做? 然后我想要画x和y。我该怎么做(使用表中的数据)
浏览 23
提问于2022-04-14
得票数 -1
3
回答
如何在
Python
中任意旋转、重新排列等
pdf
页面?
、
我有一个“正常”的input.
pdf
(许多页面都是相同的方向和方向),我想要创建一个新的
pdf
,它可以任意地重新排列输入页面。 我只需要旋转和缩放。我不需要摆弄
文字
、颜色、剪裁等。在伪代码中,这些都是我需要的特性:out = new_
pdf
() p.add (in.get_pageout.add(p) out.save("output
浏览 8
提问于2020-11-14
得票数 9
回答已采纳
点击加载更多
相关
资讯
Python实现读取PDF文件案例
使用go-fitz读取PDF
【Python】文件的读取
利用python读取文件
python xlrd 读取excel
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券