首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    SpringBoot 下PDF生成使用填坑总结

    一、PDF生成 由于直接使用IText生成PDF,数据填充较为繁琐,故: 选用Freemarker和IText生成pdf,引入依赖: 环境:jdk 1.8 + SpringBoot 1.引入freemarker...注意:模板标签(h5)容易报错,一旦模板出现问题,可优先排查标签嵌套问题,例:table标签不能嵌套div标签 二、PDF转换为图片 pdf转图片有两种方式:icepdf和pdfbox 上面两种方式都实现过...,都存在中文不显示或者乱码问题,但是由于icepdf最多只能支持转换10页pdf,所以果断选择pdfbox。...,如果将生成pdf和pdf文件转图片连起来还是会有中文显示乱码的问题: 复现方式:生成pdf文件后下载,然后上传(上传的时候,pdf转图片存储),预览图片,发现图片中的中文显示乱码。...千万要注意:一定要刷新缓存,因为这个问题搞了好久,虽然运维同学刷新过字体库,但是一次不生效,切记,尽量刷新多次。 到此,中文不显示的问题完美解决。

    4.8K30

    多种格式文件合并为pdf(大数据量)

    富文本与档案的绑定关系是多对一,也就是多个富文本绑定一个档案,现在有个问题就是我们系统都是档案都是以pdf进行展示的,而客户那边档案下对应的富文本是多种数据类型的包括以下几种:jpg,png,jpeg,...pdf,tif,tiff 所以我要去做兼容也就是说需要把档案下对应的各种格式的富文本拼接成一个pdf,然后再去展示。...contents = new PDPageContentStream(pdf, page); float height = page.getMediaBox()...,而且每次都是多个文件,所以这个方法的执行时间会比较长,而且在执行的过程中会产生大量的临时文件,这样会导致服务器的磁盘空间不足,所以使用了流代替temp。...、既要有序也要保证大文件和多页数时候的效率,并且要保证有序合并 4、同时还要兼容各种不同的类型,所以就需要对不同的类型进行不同的处理 优化后的代码 logger.info("开始转换pdf");

    28820

    五分钟实现pdf分页

    对于pdf文件,也同样有apache的pdfbox(官网:https://pdfbox.apache.org/),和itextpdf(官网:https://itextpdf.com/)包可以使用。...PDFBox: PDFBox 是 Java 实现的 PDF 文档协作类库,提供 PDF 文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具。...PDFBox提供的主要功能有: 从 PDF 提取文本 合并 PDF 文档 PDF 文档加密与解密 与 Lucene 搜索引擎的集成 填充 PDF/XFDF 表单数据 从文本文件创建 PDF 文档 从 PDF...页面创 建图片 打印 PDF 文档 itextpdf: iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。...iText的安装非常方便,下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。

    1.9K20

    AI文档智能助理都是如何处理pdf的?

    一、前言 在AI盛行的当下,基于文档的本地知识库智能问答系统已经成为当下最受AI从业者欢迎的落地方式。本文旨在收集整理当下AI应用中使用较多的处理pdf的库和开源项目,喜欢的请点赞、收藏。...附上几篇之前整理过的pdf相关的AI应用: 如何打造本地知识库——那些与Chat Pdf相关的几款开源热门跑车级应用 pdfGPT——通过AI与上传的PDF文件进行聊天 localGPT——一款100%...Apache PDFBox Apache PDFBox库是用于处理PDF文档的开源Java工具。该项目允许创建新的PDF文档,操纵现有文档以及从文档中提取内容的功能。...OpenPDF OpenPDF[11] OpenPDF是一个Java库,使用LGPL和MPL开源许可证。可以拥有创建和编辑PDF文件。...命令行工具是一种在计算机上通过命令行界面执行操作的工具。•docx2pdf[25] 这段文本介绍了如何使用Microsoft Word直接在Windows或macOS上将docx文件转换为pdf格式。

    94720

    java PDF开源库选择与iText发展历史

    2. java PDF开源库 2.1 各方开源库 其实就PDF SDK而言,有很多免费的开源软件,我们列举一下参考资料3里面列举出的开源类库(估计有点老了,但是还是很有参考价值): 名称 点击次数...描述 iText 6353 iText是一个能够快速产生PDF文件的java类库。...iText的java类对于那些要产生包含文本,表格,图形的只读文档是很有用的。它的类库尤其与java Servlet有很好的给合。使用iText与PDF能够使你正确的控制Servlet的输出。...PDF Box 1958 PDFBox是一个Apache开源的x项目。可以操作PDF文档的Java PDF类库。它可以创建一个新PDF文档,操作现有PDF文档并提取文档中的内容。...-1b标准 使用标准Java打印API打印PDF文档 另存为图片文件,如PNG、JPEG 使用内嵌字体和图片从头创建PDF 电子签名PDF文件 iText: PDFBox里面的特性iText都有 iText

    7K30

    PDF转Word完全指南:3大方法满足各种场景!

    技术派:三方类库或者API实现PDF转Word技术派的PDF处理就是用第三方类库或者OpenAPI,对pdf进行处理,一般是需要批量自动的处理PDF文件时,通过类库和API就能大量的减少时间。...目前PDF的处理类库较多,我们选择几个有代表的来说下。开源类库pdfbox Java类库PDFBox是一个BSD许可下的源码开放项目,为开发人员读取和创建PDF文档而准备的纯Java类库。...itext Java类库 iText是著名的开放源码的站点sourceforge一个项目,是用于生成PDF文档的一个java类库。...iText的安装非常方便,下载iText.jar文件后,只需要在系统的CLASSPATH中加入iText.jar的路径,在程序中就可以使用iText类库了。...收费类库:说完了免费的开源类库,下面说说收费的PDF类库。

    4.5K40

    Java高效开发12个精品库

    Log4j Log4j是Apache中的一个库,可用作日志工具。 ? Log4j恰好是其所在应用领域中最可靠的库,可以扩展到支持自定义组件配置。配置语法非常简单,支持XML、YAML 和 JSON。...06. iText iText是用于在Java中创建和操作PDF件的Java开源库。 ? 最近的iText版本改头换面,加入许多新功能。基本Java中创建和操作PDF件的各种操作都能完成 07....Apache PDF box Apache PDFBox是另一个可用于操作PDF文件的开源库。...PDFBox的主要功能使其成为超级库,其中包括PDF创建、将单个PDF分割为多个PDF文件、合并并提取PDF文本的Unicode文本,填写PDF表单,根据PDF/A标准验证PDF文件,将PDF保存为图像并对...Joda Time 这就是我一直强调的简单但功能强大的库,它节省了大量的开发时间。Joda-Time是一个Java库,作为Java中日期和时间类的一个很好的替代品。

    1.4K40

    java 利用 pdfbox 实现PDF转为图片

    : * 1.如何解决 Linux 环境下乱码的问题:重写 UnixFontDirFinder 类,修改 Linux 环境下获取字体文件的路径,改为取项目里的字体文件(使用 pdfbox 转图片时的方法...转图片,demo * (使用 pdfbox) * @param pdfPath PDF路径 * @imgPath img路径 * @page_end 要转换的页码...转化为图片 * (使用 pdfbox) * @param pdDocument PDF对象 * @param page_end 要转换的页码,发票一般是一页,取第一页...想想还是研究研究 pdfbox 的源码吧,分析后发现它是根据不同系统来读取字体的文件夹的,然后一个同事建议我重写读写 Linux 系统文件的类,指向我们项目的文件夹,然后在项目新建一个文件夹来存放需要的字体...Linux 环境下乱码的问题:重写 UnixFontDirFinder 类,修改 Linux 环境下获取字体文件的路径,改为取项目里的字体文件 Copyright: 采用 知识共享署名4.0 国际许可协议进行许可

    3.8K10

    一些好用的开源控件

    新版的CKeditor修改了很多bug,所有的功能都已插件形式实现。 下面百度文库中的这篇文章介绍的比较好,如果有需要自定义代码的功能可以照下面地址做,我按照下面方法能够调通。...是我用过的做好用的缩图工具。使用.net自带的图片处理类实现缩图功能,总是感觉缩出来的图片有些毛刺。下面附上代码。.../Files/lts8989/lucene.rar 官网地址:http://lucene.apache.org/ 五、PDFBox读取PDF文件       好多对pdf操作的工具都是创建pdf文件的,...读取pdf的工具有PDFBox和iTextSharp,有网友推荐使用iTextSharp,我在项目中使用的是PDFBox,个人感觉这个工具的效率很低。...PDFBox是一个将java源码编译成.net的dll文件的工具(看到此处的时候我也感到很神奇)。以下地址不太详细的介绍了PDFBox和iTextSharp的使用。

    1.6K60

    LIMS系统仪器数据采集-使用xpdf解析pdf内容

    不同语言解析PDF内容都有各自的库,比如Java的pdfbox,.net的itextsharp。.../mahongbiao/p/3760867.html 这些类库解析PDF文本有一个弊端,就是可配置性不强,它们多数是用于PDF文件生成的,对于PDF文本内容的提取仅提供一两个函数供调用。...itextsharp或者pdfbox解析某PDF文件时,文本内容以竖排的形式输出,不易解析信息。...而使用xpdf,则可以指定-layout参数,将其按照页面显示的布局方式输出。 下图为PDF样式: ? 下图为pdfBox、itextsharp解析出的内容样式: ?...例子中的中文没有解析出来,可通过配置PDF中文字体解决,xpdf的另一个强项功能,就是它支持配置pdf字体,有些PDF内容通过itextsharp解析不出来的情况下,使用xpdf在配置了正确字体后可以解析出内容

    1.8K40
    领券