前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >13k Star!推荐一个双语对照的 PDF 翻译项目:PDFMathTranslate

13k Star!推荐一个双语对照的 PDF 翻译项目:PDFMathTranslate

作者头像
勇哥java实战
发布2025-01-08 12:40:14
发布2025-01-08 12:40:14
7600
代码可运行
举报
文章被收录于专栏:勇哥编程游记勇哥编程游记
运行总次数:0
代码可运行

今天给大家推荐一个双语对照的 PDF 翻译项目:PDFMathTranslate 。

项目地址: https://github.com/Byaidu/PDFMathTranslate

项目介绍:

基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker 。

项目亮点:

  • 基于 AI 布局分析和 PDF 指令流分析实现对文档排版的完整保留 ;
  • 保留行内/行间公式和图表样式,对 Latex 文献进行特殊优化;
  • 保留文档可索引目录结构 ;
  • 支持 Google、DeepL 和 OpenAI 等多种翻译服务 。

预览效果:

快速开始

1、确保服务器安装的 Python 版本大于 3.8 且小于 3.12 ;

2、安装此程序 ;

代码语言:javascript
代码运行次数:0
复制
pip install pdf2zh

3、打开 GUI 界面 , 访问:http://localhost:7860/

代码语言:javascript
代码运行次数:0
复制
pdf2zh -i

4、上传文件并翻译

如上图,我们上传一个英文版 PDF ,上传完成后,在预览区域会显示 PDF 的内容。

接下来,选择翻译服务 Google、Bing、zhipu、Tentcent 等和翻译方向(英文转中文),

最后点击翻译按钮即可。

当然,我们也可以使用 命令行直接翻译:

代码语言:javascript
代码运行次数:0
复制
pdf2zh raft.pdf

基本原理

核心流程:

1、上传文件后,通过 AI 模型 DocLayout-YOLO-DocStructBench-onnx 解析文档格式 ;

2、调用 Google 、智普、Bing、DeepL、OpenAI 等开放平台的服务 ;

3、将数据流整合在一起并输出到目标 PDF 。


参考资料:

https://huggingface.co/wybxc/DocLayout-YOLO-DocStructBench-onnx

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-01-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 勇哥java实战分享 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 快速开始
  • 基本原理
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档