腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
wget
和
PDFFileReader
-
无法
读取
格式
错误
的
PDF
文件
、
、
、
、
我正在尝试从希腊卫生部
的
每日报告中抓取新冠肺炎
的
数据,这些数据以
PDF
格式
发布在网上。我使用
wget
下载它们,然后使用PyPDF2从它们抓取数据: import
wget
wget
.download('https://eody.gov.gr/wp-content/uploads/2020/09/covid-gr-daily-report-23-09-2020.<
浏览 24
提问于2021-01-21
得票数 0
回答已采纳
1
回答
Python
PDF
完整性检查
、
我有一个
pdf
的
库(大多数都有一些随机压缩
的
东西,还有djvu
的
)。其中一些
pdf
已经损坏,应该删除。 有没有什么办法可以在python中做
pdf
完整性检查?
浏览 0
提问于2012-04-07
得票数 1
3
回答
如何覆盖Python当前正在
读取
的
文件
、
、
、
我不太确定这样做
的
最好方法,但我想做
的
是,
读取
pdf
文件
,进行各种修改,并将修改后
的
pdf
文件
保存在原始
文件
上。到目前为止,我能够保存修改后
的
pdf
到一个单独
的
文件
,但我希望取代原来,而不是创建一个新
的
文件
。(file('input.
pdf
', 'rb')) blank
浏览 0
提问于2010-05-01
得票数 3
回答已采纳
1
回答
ValueError:在PyPDF2上对关闭
的
文件
进行查找,并收到此
错误
、
、
我正在尝试从
pdf
文件
中获取文本。代码如下: from PyPDF2 import
PdfFileReader
pdf
=
PdfFileReader
(file) #print(dir(page)) print(page.extractText()) 这给了我一个
错误
Valu
浏览 181
提问于2019-05-05
得票数 5
回答已采纳
3
回答
将seek添加到filetype对象
的
廉价方法
、
、
、
PdfFileReader
从
pdf
文件
中
读取
内容以创建对象。从通过url下载
的
pdf
文件
创建
PdfFileReader
对象
的
简单方法是什么? 现在,我可以做些什么来避免通过file()再次
浏览 0
提问于2010-04-16
得票数 2
回答已采纳
1
回答
TypeError:字符串索引必须是pdfreader中
的
整数
运行此代码时read_bikeins =
pdf
.
PdfFileReader
(bikeins)
文件
"",第1行,在read_bikeins =
浏览 1
提问于2018-02-27
得票数 0
4
回答
PyPDF2 IOError:[Errno 22]关于PyPdfFileReader Python2.7
的
无效论证
、
、
目标=打开
文件
,加密
文件
,写入加密
文件
。Traceback (most recent call last): File "CommissionSecurity.py",
浏览 2
提问于2015-11-21
得票数 1
回答已采纳
1
回答
PdfReadWarning:
PdfFileReader
流/
文件
对象未处于二进制模式
、
我有很多
pdf
页面,我想把它们合并成一个
文件
。我
的
脚本如下:filename_list=[]for(filename) merger.append(
PdfFileReader
(open(filename),'rb')) merger.write('output.
浏览 6
提问于2014-04-01
得票数 9
3
回答
读取
目录中
的
所有
PDF
(图像)
、
、
、
我附上了一张图片,以帮助展示我所做
的
事情。我正在尝试编写一个程序,该程序将添加一个空白页到目录中具有奇数页
的
所有
PDF
。然而,我似乎
无法
读取
一个目录中
的
所有
PDF
。我有一个单一
的
PDF
的
脚本工程,但我有1000
的
这些要做
的
。为什么我
无法
读取
user_input目录下
的
所有
PDF
文件
?代码在这里
浏览 3
提问于2017-02-06
得票数 0
1
回答
打印到
pdf
文件
中每页第一行
的
excel
、
、
、
、
我是python
的
新手,只有一个用来在pdfs中搜索字符串
的
脚本。现在,我想建立脚本,这将给我在新
的
CSV/xlsx
文件
的
结果,在那里我将有给定
的
pdf
文件
的
第一行和他们
的
页码。现在,我有下面的代码来打印整个页面: from PyPDF2 import
PdfFileReader
pdf
_document = "example.
pdf
&quo
浏览 26
提问于2020-11-06
得票数 0
1
回答
遍历目录时
的
字数统计
PDF
文件
、
、
、
、
我正在尝试构建一个Python程序,它将遍历一个目录(以及所有子目录),并对所有.html、.txt
和
.
pdf
文件
进行累计字数统计。当
读取
.
pdf
文件
时,它需要一些额外
的
东西(
PdfFileReader
)来解析
文件
。在解析.
pdf
文件
时,我得到以下
错误
,程序停止: AttributeError:'
PdfFileReader
‘对象没有'start
浏览 36
提问于2018-03-06
得票数 1
回答已采纳
3
回答
PdfFileReader
: PdfReadError:
无法
在指定位置找到xref表
、
我试图通过以下方法
读取
python中
的
Pdf
文件
:test_reader =
PdfFileReader
(file("test.
pdf
", "rb"))PyPDF2.utils.PdfReadError: Could not find xref table at specified location
浏览 7
提问于2015-12-05
得票数 6
回答已采纳
1
回答
可编辑
的
pdf
文件
无法
使用pypdf2
读取
、
、
、
我有
pdf
文件
,这是可编辑
的
意思是当我打开
pdf
时,我可以选择
和
更改
pdf
格式
的
下拉选项。这个
pdf
我试图通过pypdf2模块
读取
,但没有任何东西作为输出。你们能让我知道我如何阅读
和
把输出从可编辑
的
pdf
到json
格式
。感谢在advance.As中,你可以在屏幕截图中看到,打开
pdf
文件
后,我们改变了数据。我尝
浏览 5
提问于2020-07-06
得票数 0
1
回答
如何使用PyPDF2从上传到Google App Engine
的
PDF
中提取文本?
、
、
有没有办法从通过谷歌应用程序引擎上传
的
PDF
文件
中提取文本
和
documentInfo?我想使用PyPDF2,我
的
代码是:
pdf
_reader = pypdf.
PdfFileReader
(
pdf
_file)Traceback (most recent call last): ....File
浏览 4
提问于2014-01-13
得票数 0
3
回答
如何在python中从
文件
夹中逐个
读取
pdf
文件
、
我正在阅读
pdf
文件
,并试图通过NLP techniques.Right从它们提取关键字,现在程序一次只接受一个
pdf
。我在D盘上有一个
文件
夹,叫做'
pdf
_docs‘。该
文件
夹包含许多
pdf
文档。我
的
目标是从
文件
夹中一个接一个地
读取
每个
pdf
文件
。我如何在python中做到这一点。到目前为止成功运行
的
代码如下所示。import PyPDF2 file
浏览 3
提问于2018-10-28
得票数 0
回答已采纳
1
回答
pyPdf
错误
无效参数
、
、
、
、
实际上,我正在使用pyPdf打开、
读取
和
写入
PDF
文件
的
内容。为此,我使用以下几行代码:content =
pdf
.getPage(1).extractText() pr
浏览 1
提问于2012-05-23
得票数 6
1
回答
OSX中
的
pyPDF IOError异常
、
我正在尝试使用
PdfFileReader
从pyPdf模块打开一个
pdf
(名为kalimera.
pdf
),使用以下一组命令我得到以下
错误
: Traceback (most recent call last):File "&
浏览 1
提问于2016-02-09
得票数 0
2
回答
PyPDF2中仍然存在"
PDF
文件
尚未解密“问题
、
、
、
在使用PyPDF2
读取
PDF
文件
时出现以下
错误
raise utils.PdfReadError("File has not been decrypted") PdfReadError: File hasnot been decrypted 我一直在尝试通过python以编程方式
读取
PDF
文档。对于大多数
PDF
文件
,它工作得很好,但对于少数
文件
,我得到以下
错误
raise utils.PdfRea
浏览 288
提问于2019-02-12
得票数 3
回答已采纳
1
回答
如何
读取
亚洲语言(中文、日文、泰文等)
的
PDF
文件
并将字符串存储在python中。
、
、
、
、
我使用PyPDF2
读取
python中
的
PDF
文件
。虽然它适用于英语
和
欧洲语言
的
语言(英文字母),但图书馆
无法
阅读亚洲语言,如日语
和
汉语。我尝试过其他库,如textract
和
PDFMiner,但都没有成功。 当我从
PDF
中复制文本并将其粘贴到笔记本上时,字符就会变成一些随机
格式
的
文本(可能是以不同
的
编码方式)。def convert_
pdf
_to_
浏览 1
提问于2018-06-22
得票数 4
回答已采纳
1
回答
无法
使用Python3.x: DependencyError: PyCryptodome算法查找
PDF
的
页数
、
我正在对从url下载
的
文件
执行数据验证。其中一个验证检查涉及检查
PDF
的
页数。使用PyPDF2包
和
PdfFileReader
模块,直到我遇到一个具有权限密码但没有打开密码
的
256位AES加密
的
PDF
。我
无法
访问任何密码,因为这些
文件
来自制造商网站,所以我
的
结论是,目前我只需检查
PDF
是否加密,如果是的话,暂时跳过它,但不管我是否试图检索页面计数或检查
PDF
浏览 9
提问于2022-08-29
得票数 0
回答已采纳
点击加载更多
相关
资讯
用python操作PDF文件
用Python实现一款永久免费的PDF编辑工具
你还在傻傻花钱编辑pdf格式?咋不用Python?(和猫妹学Python)
保护您的文件权益:掌握PDF格式转换和优化的终极工具!
聊聊 python 操作PDF的几种方法
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券