首页
学习
活动
专区
圈层
工具
发布

PDF Explained(翻译)第二章 构建一个简单的PDF

本文是对PDF Explained(by John Whitington)第二章《Building a Simple PDF》的摘要式翻译。 本章我们将使用文本编辑器手动构建PDF内容。...关于PDFTK(THE PDF TOOLKIT) pdftk是一个开源的命令行程序,它的功能有: 合并分割PDF文档 旋转PDF页面 加解密 填充PDF表单 加水印和图章 打印和修改PDF元数据(metadata...) 添加附加 基本的PDF语法 PDF文件至少包含三种不同的语言: document content(文档内容),是由众多对象连接而成的有向图。...file structure(文件结构),包括header(文件头),trailer(文件尾)和交叉引用表,帮助程序定位并读取文件内容。...第一行将文件标识为PDF并给出版本号: %PDF-1.1 //PDF version 1.1 header 第二行很难输入文本编辑器,因为它包含不可打印的字符。 我们将它留给pdftk处理。

2K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    AI翻译英语PDF文档的3种方法

    短的文章,直接丢进kimichat、ChatGPT里面很快就可以翻译完成,而且效果很佳。但是,很长的PDF文档整篇需要翻译,怎么办呢?...●腾讯交互翻译TranSmart https://transmart.qq.com/ 软件下载后,点击左边的文件翻译,然后选择PDF文档,即可快速完成翻译。...) 800万字符、有页数的docx/pdf/pptx300页、文本文件(txt)10MB、二进制文件(pdf/docx/pptxxlsx)40MB 腾讯交互翻译的翻译质量一般,要求不高的话够用,但谈不上很好...翻译完后可以导出译文,可以双语对照,也可以只要译文。 可以选择多个翻译引擎,免费的是微软bing、谷歌翻译,deepL、openAI和chatgpt的则要收费。 免费的也是效果一般。...其他还有很多类似的功能,比如WPS文档的全文翻译功能、腾讯文档的PDF翻译、微信读书的全文翻译、calibre翻译插件「Ebook Translator」、风声雨声(fsys.app)等。

    1.2K10

    好用的PDF翻译工具有哪些?-TOP5推荐,对PDF格式错乱说不!

    科研党熬夜翻译论文却遭遇表格错乱,商务人士处理合同翻译后格式全乱需重新排版,学生党因PDF翻译工具收费限制无法完成文献阅读——这些场景是否让你倍感困扰?...一、测评维度与工具说明本次测评选取的5款工具均为当前市场活跃度较高的PDF翻译解决方案,涵盖专业软件、在线工具及综合平台:会译:全场景智能翻译插件的PDF专项功能,以多AI模型协同和格式保真为核心卖点Adobe...翻译过程中实时显示进度条,完成后自动生成"原文/译文/双语对照"三种查看模式切换按钮。...对比来看:Adobe Acrobat月费158元起,对个人用户门槛较高;DeepL免费版5000字符/月,超额后按0.02美元/百字符收费,翻译一本200页的论文约需20美元;Google Translate...2025年最值得推荐的PDF翻译工具。

    72610

    【软件】免费的PDF全文翻译软件,能保留公式图表的样式

    ​ 转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 很多PDF全文翻译软件都是收费的,而划线翻译看着又很累。...这个开源的PDF全文翻译软件非常好用,并且能够保留公式、图表、目录和注释。可以看看他的效果:接下来开始安装。...1、先到仓库下载安装包:基于 AI 完整保留排版的 PDF 文档全文双语翻译2、解压后进入build目录,运行pdf2zh.exe。3、启动成功后,会自动打开网页。...4、可以选择不同的翻译接口,非常丰富。但是AI相关的是需要key的,一般选择Bing、Google的也够用了。5、我们可以测试一下。可以看到效果非常不错。...6、翻译的文件可以从左下角下载,第二个是双栏的。​

    43910

    推荐一个双语对照的 PDF 翻译工具的开源项目:PDFMathTranslate

    今天给大家推荐一个双语对照的 PDF 翻译工具的开源项目:PDFMathTranslate 。...项目介绍:基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker 。...:7860/pdf2zh -i4、上传文件并翻译如上图,我们上传一个英文版 PDF ,上传完成后,在预览区域会显示 PDF 的内容。...当然,我们也可以使用 命令行直接翻译: pdf2zh raft.pdf基本原理核心流程:1、上传文件后,通过 AI 模型 DocLayout-YOLO-DocStructBench-onnx 解析文档格式...;2、调用翻译服务 Google 、智普、Bing、DeepL、OpenAI 等开放平台的服务 ;3、将数据流整合在一起并输出到目标 PDF 。

    97910

    【python爬虫】批量识别pdf中的英文,自动翻译成中文下

    之前的文章提供了批量识别pdf中英文的方法,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文上,本文实现自动pdf英文转中文文档。...,然后调用函数输出翻译后的内容。...注意,本文中的wd和wd2是【python爬虫】批量识别pdf中的英文,自动翻译成中文上文章中识别的,murphy1996.pdf中的两页。...在从病变拭子中分离出一个疗程的nma并诊断为化疗(包括鞘内甲氨蝶呤)后2周,P.aerugi因发烧入院 EG was made....4.和识别pdf文章结合,写循环一次把所有文章翻译出来,并生成对应的中文文档。 5.把代码转换成html文档,让没有安装python的小伙伴也可以使用。

    90320

    推荐一个双语对照的 PDF 翻译项目:PDFMathTranslate

    今天给大家推荐一个双语对照的 PDF 翻译项目:PDFMathTranslate 。...项目地址: https://github.com/Byaidu/PDFMathTranslate 项目介绍: 基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama...//localhost:7860/ pdf2zh -i 4、上传文件并翻译 如上图,我们上传一个英文版 PDF ,上传完成后,在预览区域会显示 PDF 的内容。...当然,我们也可以使用 命令行直接翻译: pdf2zh raft.pdf 基本原理 核心流程: 1、上传文件后,通过 AI 模型 DocLayout-YOLO-DocStructBench-onnx 解析文档格式...; 2、调用 Google 、智普、Bing、DeepL、OpenAI 等开放平台的服务 ; 3、将数据流整合在一起并输出到目标 PDF 。

    57510

    PDFTransMate:完美保留排版的PDF翻译神器,GitHub热门且支持私有化部署

    对于包含LaTeX数学公式的PDF,它利用mathpix-snippet或sympy等库进行公式识别与解析,确保翻译后的公式保持原样。...翻译引擎集成:支持Google翻译、DeepL、Azure、OpenAI GPT-4和Ollama等先进的翻译引擎,通过API接口进行集成。...提供RESTful API接口,允许开发者根据需求进行功能扩展,如集成到现有的文档管理系统或翻译平台中。性能优化:使用多线程和异步IO来提高翻译速度,特别是在处理大型PDF文档时。...例如,一个数学专业的博士生使用PDFMathTranslate将一篇英文的学术论文翻译成中文,翻译后的文档不仅保持了原文的公式和图表,还提供了准确的术语翻译。...一个出版社使用PDFMathTranslate将一本关于机器学习的英文电子书翻译成中文,翻译后的电子书在格式和排版上与原文保持一致,受到了读者的好评。

    4.5K20

    16.1K Star开源一款支持网页和 PDF 的划词翻译工具

    CopyTranslator是一款开源软件,旨在提供高效的翻译工具。它的主要功能是将用户选择的文本或整个文档快速翻译成其他语言。支持网页和 PDF 的划词翻译工具。...有了它就可以解决阅读 PDF 文件时,要翻译大段内容情况下的乱码、换行、翻译不准的问题 img img entoch 软件介绍 CopyTranslator使用Python编写,并利用了机器学习和自然语言处理技术...它可以轻松集成到用户的文本编辑器或浏览器中,使其成为一个强大的辅助翻译工具。这款软件提供了多种翻译引擎的支持,包括Google翻译、百度翻译等,确保用户能够选择适合自己需求的翻译服务。...2.选择翻译引擎:打开软件的设置界面,选择合适的翻译引擎。根据需要,你可以配置多个翻译引擎来实现灵活的翻译选择。 3.设置翻译快捷键:在软件设置中,设置你喜欢的翻译快捷键。...这将使你能够轻松地触发翻译功能。 4.开始翻译:打开你的文本编辑器或浏览器,选择你要翻译的文本,按下设置的翻译快捷键,CopyTranslator将会自动翻译你所选择的内容。

    63310

    PDF翻译神器,再也不担心读不懂英文Paper了

    然后,接下来的画面更加惨不忍睹……直接通过PDF复制粘贴到翻译引擎中的文档,对多余换行并没有任何处理。 ?...近日,营长发现一款体验“十分优秀”的复制即翻译的外文辅助阅读翻译解决方案——CopyTranslator,它很好地解决了PDF文本换行的麻烦,并借助谷歌翻译API支持,在速度和质量上都有了很好的满足。...、Baidu 、DeepL 、Google 、Microsoft 、Naver、Promt SDL、Yandex、youdao 等多款翻译引擎 API。...值得一提的是,只有营长关闭了 360 等各类防火墙后,才能使用该款软件,否则就得出现以下不友好的画面(请小心使用)。 ? 看完以上的主要功能和试用情况,我相信大家都对两款翻译工具有一个清晰的认知了。...从最根本的功能性来讲,QTranslate 胜在有多款翻译引擎工具支持,可迅速选取合适的翻译工具,并进行翻译;而 CopyTranslator 的强大之处在于对 PDF 等格式文本的快速复制,达到了复制即翻译的速度

    4.4K30

    一款可以完整保留排版的PDF翻译:GitHub增长第一、可私有化部署

    最近看论文较多,顺手给大家推荐一个用下来觉得不错的开源PDF翻译工具:PDFMathTranslate 目前这款开源项目在GitHub上已经收获了7.6K Star,而且由于一直处于增长趋势榜第一的位置...PDF翻译最大的亮点是能够保留原始排版,其中包括:公式、图表、目录以及批注。...此外,PDFMathTranslate 还有其他不错的特点,包括: • 支持多种语言的翻译 • 可接入多种不同的翻译服务,具体如下: PDFMathTranslate 快速上手 命令行方式 #安装 pip...install pdf2zh # 翻译 pdf2zh document.pdf Docker安装部署 拉去镜像和Docker部署: docker pull byaidu/pdf2zh docker...run -d -p 7860:7860 byaidu/pdf2zh 部署完成后,就可以通过浏览器查看了,访问地址:http://localhost:7860/ 有NAS或者服务器的,也可以直接部署在自己环境来使用

    63010

    「学术翻译灾难现场!你的PDF被译成氧气平方了吗?2025会译实测:代码公式0误差」

    导语>测试10款主流翻译工具后,我们发现:学术党用错插件,轻则术语错译丢分,重则代码注释混乱!会译凭借IEEE论文训练引擎+智能排版锁定,成为唯一解决GitHub技术文档与SCI论文翻译的利器。...- 场景1:PDF公式翻译崩坏 - 竞品:将数学公式 `$O(n^2)$` 译成“氧气平方”(沉浸式翻译常见错误) - 会译方案:内置LaTeX解析器,保留公式原格式 → 译文仅注释说明 - 场景2...:代码注释翻译灾难- 竞品:把 `// Initialize array` 译成“初始化排列”(丢失编程语义) - 会译方案:识别50+编程语言关键词,注释翻译后自动添加`[译注]`标记 二、终极实测...- 测试样本IEEE论文10篇 + GitHub热门技术库5个(含Spring/Docker文档)▶ 关键性能对比表评测维度会译沉浸式翻译差距PDF术语准确率✅ 92.3%78.1%+14.2%代码注释保留率...」——GitHub 5K星开发者@MikeChen > 「医学论文里的’placebo-controlled trial’,竞品译成’安慰剂控制审判’,会译准确输出’随机对照试验’」——浙大医学院博士生

    27910

    完整教程:沉浸式翻译插件安装、使用与OpenAI API Key配置指南

    快速上手:一键开启你的双语世界安装并固定“沉浸式翻译”的图标后,在需要翻译的外文网页上激活它非常简单,你可以根据自己的习惯选择以下任一方式:点击工具栏图标: 这是最直接的方式,只需点击浏览器工具栏上已固定的...使用右键菜单: 在网页的空白区域点击鼠标右键,在弹出的菜单中选择类似于“翻译网页 / 显示原文”的选项即可。启用与关闭翻译通常情况下,执行上述任何操作后,插件会自动识别并翻译页面的主要内容区域。...要使用此功能,你需要先在相应的服务商处注册并获取 API Key,然后在插件设置的“翻译服务”部分进行配置。这为高级用户提供了极大的灵活性和控制权。...保留排版: 这是 PDF 和 EPUB 翻译的一大亮点。插件会尽力在翻译后保持文档原有的格式和布局,包括段落、标题、列表,甚至表格。...翻译本地文件: 再次强调,你可以通过插件菜单上传本地的 HTML、TXT、PDF 等文件进行翻译,或者在 Chrome/Edge 浏览器中开启文件访问权限后直接用浏览器打开这些文件进行翻译。

    7.3K00

    20篇「ACL2020」!抢先看自然语言处理2020在研究什么?

    其接收的论文覆盖了对话交互系统、语义分析、摘要生成、信息抽取、问答系统、文本挖掘、机器翻译、语篇语用学、情感分析和意见挖掘、社会计算等自然语言处理领域众多研究方向。...该会议的论文基本代表自然语言处理领域最新研究进展和最高研究水平,受到学术界和产业界的高度关注。 1....BPE-Dropout:简单有效的子词正则化,Simple and Effective Subword Regularization,俄罗斯Yandex ?...基于领域自适应的减少神经机器翻译中的性别偏见,Reducing Gender Bias in Neural Machine Translation as a Domain Adaptation Problem...https://arxiv.org/pdf/2004.03809.pdf ? 20. FastBERT:一种具有自适应推理时间的自适应BERT?

    1.3K10

    GPT学术优化 (GPT Academic):支持一键润色、一键中英互译、一键代码解释、chat分析报告生成、PDF论文全文翻译功能、互联网信息聚合+GPT等等

    chat分析报告生成 [函数插件] 运行后自动生成总结汇报 PDF论文全文翻译功能 [函数插件] PDF论文提取题目&摘要+翻译全文(多线程) Arxiv小助手 [函数插件] 输入arxiv文章url即可一键翻译摘要...程序包含多个函数,其中 下载arxiv论文并翻译摘要 函数的作用是下载 arxiv 论文的 PDF 文件,提取摘要并使用 GPT 对其进行翻译。...写入完成后将文件路径打印出来。 gen_file_preview(file_name):从传入的文件中读取内容,解析出对话历史记录并返回前100个字符,用于文件预览。...在导入了一系列库和工具函数后,主要定义了5个函数,其中包括一个错误处理装饰器(@CatchException),用于批量总结PDF文档。该函数主要实现对PDF文档的解析,并调用模型生成中英文摘要。...程序实现了一个批量翻译PDF文档的功能,可以自动解析PDF文件中的基础信息,递归地切割PDF文件,翻译和处理PDF论文中的所有内容,并生成相应的翻译结果文件(包括md文件和html文件)。

    3.6K30

    从网页到 PDF,这款翻译工具全搞定

    但翻译工具的“翻车现场”也不少见——普通翻译插件直接覆盖原文导致格式错乱,代码块、公式被拆解得支离破碎;专业术语翻译不准,“API endpoint”翻成“应用编程接口终点”让人摸不着头脑;PDF翻译后乱码一堆...实测翻译一段Go语言的接口文档:“The function returns an error if the context is cancelled”,通用工具可能翻成“如果上下文被取消,该函数返回错误...”,而会译则精准输出“若上下文被终止,该函数将返回错误信息(注:context在Go中用于控制goroutine的生命周期)”。...更细节的是,像“API endpoint”这种高频技术词,会译还会用标红标注并补充注释,相当于自带“术语词典”。...翻译:上传PDF后,系统会自动识别段落、公式、表格,翻译结果与原文位置、字体完全一致。

    38810
    领券