腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
PDFX
Python
库
将
PDF
转
换为
Json
、
、
、
、
我正在尝试
将
.
PDF
文件转
换为
JSON
文件,以便更容易地从中提取信息。我可以从.
PDF
文件中获取元数据,但是它只有第一页,或者看起来像是.
PDF
的参数,但它没有列出实际的数据。下面是我的代码。这很简单,因为我还在学习如何
使用
这个
库
,这是我能够从
库
网站上的文档中获得的。import
pdfx
pdf
=
pdfx
.
PDFx
("Q1_Employee_Ea
浏览 14
提问于2018-02-18
得票数 1
1
回答
在
Python
中从假脱机
pdf
文件中提取超链接
我从前端获取表单数据,并
使用
快速api读取,如下所示: @app.post("/file_upload") print("Content = ",
pdf
.content_type,
pdf
.filename,
pdf
.spool_max_size) return {"filename"File not Found"
浏览 26
提问于2021-11-13
得票数 1
回答已采纳
1
回答
Ghostscript目前可以
将
PDF
转换成
PDF
/X吗?
、
、
印刷厂要求我的论文
PDF
符合
PDF
/X1a:2001。内容文件是
使用
XeTeX LaTeX编译的,第二个
PDF
是用Inkscape 0.48完成的封面设计。我在这篇文章中找到的最接近的答案是:,如果我正确理解的话,至少可以用
将
PDF
转换成
PDF
/X。 如前所述,转
换为
PDF
/X需要一个有效的ICC配置文件。我
将
.icc文件添加到目标
pdf
文件的同一个文件夹中(这要感谢V
浏览 6
提问于2015-02-20
得票数 2
回答已采纳
1
回答
Linux中的Ghostscript : CMYK到CMYK
、
、
为了方便其他问题,我将
使用
这些数字。几个小时后,我终于能够
将
sRGB
PDF
(1)转
换为
CMYK (2),方法是将来自的答案组合在一起。最困难的部分是让‘识别’检测到新的
PDF
实际上是CMYK。下一步应该很简单,我想,只需将CMYK
PDF
转
换为
CMYK EPS。但这才是我真正被困的地方。我在(2)上
使用
下面的bash脚本'
pdf
2eps.sh‘来获得(3)。 #!您可以
使用
所提供的数字进行检查。我真的不
浏览 0
提问于2017-02-21
得票数 1
1
回答
使用
PDFX
http://
pdfx
.cs.man.ac.uk/实现
PDF
到XML的转换
、
、
我知道
PDFX
是一个基于规则的系统,旨在以
PDF
格式重建学术文章的逻辑结构,而不考虑其格式样式。系统的输出是一个XML文档,它从标题、节、表、引用等方面描述输入文章的逻辑结构。我一直在尝试在
python
上
使用
PDFX
将
一些
PDF
文件转换成XML,但是http://
pdfx
.cs.man.ac.uk/没有响应。我用于转换的代码是: response = requests.post('http://
浏览 12
提问于2021-08-26
得票数 0
回答已采纳
2
回答
如何从
pdf
文件中提取所有链接?
、
、
“
PDF
编辑器也在突出显示文本链接,他们怎么知道这段文本是超链接?
浏览 7
提问于2015-07-16
得票数 15
1
回答
在CodeIgniter视图中以<object>标签显示
PDF
、
、
、
、
最终,我想要做的是获取一个.docx文件,将其转
换为
超文本标记语言,然后将该超文本标记语言转
换为
PDF
并将其嵌入到我的视图中。我希望在不将
PDF
保存到文件的情况下完成所有这些操作,而是直接在我的视图中显示它。 到目前为止,我已经能够
将
.docx转换成超文本标记语言,然后再转换成
pdf
格式。但是,我现在遇到了如何在视图中显示
pdf
字符串问题。目前,我正在尝试
将
一个具有
pdf
头的视图加载到一个变量中,然后将该变量发送到我的视图以在标签中显
浏览 2
提问于2015-11-20
得票数 2
回答已采纳
1
回答
使用
jobconverter
将
pdf
转
换为
pdf
/a的问题
、
、
、
正在尝试
使用
http://kapion.ru/convert-to-pdfa-with-jodconverter/指南
将
pdf
转
换为
pdf
/a。执行后得到编码的
pdf
文件。看起来是这样的: %
PDF
-1.51 0 obj <</Type/Catalog/Pages 2 0 R/Lang(de-CH) /StructTreeRoot 17 0 R&
浏览 82
提问于2021-09-23
得票数 0
回答已采纳
1
回答
将
PDF
中的文本提取为
JSON
或XML或其他格式?
、
、
我试图从
PDF
中提取数据,价格,信息和数字(我有超过10000个
PDF
,所以网站的免费试用将不起作用)。下面是我得到的一个
PDF
示例:我用
Python
语言(这类任务的初学者,还有
Python
语言)和几个包(如PyPDF2、
pdfx
等等)尝试过,但我只能得到这样的文本 所以可以提取价格,数字和信息,但我有不同的
pdf
格式,所以不可能只
使用
文本和一些算法来提取信息。我想以垂直方式读取它,并转换以XM
浏览 2
提问于2019-01-01
得票数 0
5
回答
将
PDF
转
换为
CMYK (识别CMYK)
、
、
、
、
因此,没关系,那么我想我最好尝试
使用
ghostscript
将
test.
pdf
转换成一个新的
pdf
,这将被identify识别为CMYK --但是即使在那里也没有运气: $ gs -dNOPAUSE -dBATCH同时,请注意,identify 是能够正确报告CMYK的-参见获取
使用
convert和gs生成这样一个
pdf
文件的命令行示例。这个
将
产生一个,它将被identify编辑为CMYK -然而,该
PDF
也将被光栅化(默认为72 dpi)。所以我想我的
浏览 6
提问于2011-06-05
得票数 31
回答已采纳
4
回答
文档转
换为
PDF
、
、
、
我需要
使用
C#/VB.Net
将
下面提到的文件格式转
换为
pdf
。用户将
使用
FileUpload控件上传文件,系统将在转换文档后返回
pdf
文件。doc/docx
转
pdf
xls/xlsx
转
pdf
ppt/pps
转
pdf
谢谢
浏览 8
提问于2010-05-20
得票数 2
回答已采纳
1
回答
如何
将
json
格式转
换为
pdf
格式
、
、
、
、
我得到一个带有图像的base64编码的
pdf
文件,这是以
json
格式发送的。但我不知道如何
将
所有这些解码回
pdf
,例如将其保存在我的计算机上。例如,这就是我收到的(不幸的是,由于他的长度,我不能添加完整的
json
): {'img': 'JVBERi0xLjcKJeLjz9MKNCAwIG9iago.......'}
浏览 123
提问于2021-07-15
得票数 0
回答已采纳
1
回答
在
python
中从字符串中提取变量和数据
、
、
我正在
将
perl散列操作为
python
字符串。新的
python
字符串包含变量和数据,示例如下: {hash: 1}, b:5}another_variable =[a我只需要将第一个变量(Task)放入
python
变量(应该以dict列表结束)。
浏览 2
提问于2019-12-04
得票数 0
1
回答
Django Streaming DumpData
、
、
如何让Django的dumpdata管理命令
将
内容流式传输到文件中,而不是
将
所有内容加载到内存中?我正在尝试
将
1 1GB的Sqlite3数据
库
转
换为
PostgreSQL,我正在考虑的一种方法是
使用
python
manage.py dumpdata --all --format=
json
> mydatabase.
json
将
数据
库
转
储为
json
。
浏览 2
提问于2011-10-30
得票数 4
回答已采纳
2
回答
使用
API调用base64到ReactJS中的
PDF
文件
、
我很难在浏览器中显示
PDF
,尽管我正在获取Base64代码,并且
使用
onlinetool(),我可以看到代码转
换为
存储在后台的正确的
PDF
文件。之后,我转
换为
blob对象,然后当我单击按钮时,它似乎不会在adobe阅读器中打开。(); headers.append("responseType&q
浏览 11
提问于2020-07-31
得票数 0
回答已采纳
2
回答
在POST中以base64格式发送
pdf
文件
、
、
、
、
我想通过POST发送一个
pdf
文件到端点url,但是它需要在base64中。我将在
JSON
中发送其他参数,但不知道如何
将
pdf
文件转
换为
base64并将其添加到
JSON
中。在web上
使用
base64
转
换器并复制文本并将其作为字符串粘贴到
JSON
中会更容易吗?
浏览 3
提问于2016-05-13
得票数 2
回答已采纳
1
回答
使用
Python
,
将
google.cloud.bigquery.job.query.QueryJob输出保存到本地
JSON
文件
、
、
我们
使用
库
在
python
中将BigQuery导出到本地
JSON
文件:import
json
full_query = """ FROM (select * from bigquery-public-data.baseball.schedules) AS t "&quo
浏览 0
提问于2021-08-10
得票数 0
2
回答
使用
PHP合并两个
PDF
(版本> 1.4)
、
、
我有一个问题,
将
两个
pdf
合并为一个
pdf
。我
使用
的是FPDF + FPDI,也尝试了TCPDF + FPDI,但是当我
使用
pdf
版本> 1.4时,我遇到了一个问题,这个错误是: FPDF错误:这个文档(
pdf
_dump/1407303457.
pdf
)可能
使用
了FPDI附带的免费解析器不支持的压缩技术。我不想
使用
fpdi的商业插件。是否有任何工作可用的
pdf
> 1.4版本。
浏览 9
提问于2014-08-06
得票数 0
回答已采纳
1
回答
Adobe
PDF
SDK - PDDocColorConvertEmbedOutputIntent和PDFA
、
、
、
我正在
使用
数据逻辑
库
9.1,并且我正在尝试
将
OutputIntent嵌入到我正在创建的
PDF
中,以便它将符合PDFA-1B。我正在
使用
PdDocColorConvertEmbedOutputIntent来完成此操作,并且函数调用成功。意图是进入那里,我可以在Adobe印前检查中看到它。我认为这可能是因为我
使用
此方法创建的PDFA有一个子类型为"GTS_
PDFX
“的outputIntent (如印前检查中所示)。我认为它需要是"GTS_PDFA“。这种
浏览 4
提问于2011-12-30
得票数 2
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券