我在尝试将PDF(XFA)转换为字符串时遇到以下错误。当我从PDFBox 1.8.12切换到PDFBox 2.0.4时,这些错误开始出现
这是日志
Mar 09, 2017 7:16:07 AM org.apache.pdfbox.pdfparser.BaseParser parseCOSArray
WARNING: Corrupt object reference at offset 779916
Mar 09, 2017 7:16:07 AM org.apache.pdfbox.pdfparser.BaseParser parseCOSArray
WARNING: Corrupt obje
我从Matlab打电话给PDFBox,想知道在一个PDF中有多少页。所有的工作与Matlba,2016年b和以前都很好。我可以导入库并加载PDF,而不会出现问题:
import org.apache.pdfbox.pdmodel.PDDocument;
pdfFile = PDDocument.load(filename);
当我在207 a运行相同的东西时,我会得到以下错误:
No method 'load' with matching signature found for class
'org.apache.pdfbox.pdmodel.PDDocument&
我使用Apache PDFBox将不同的PDF文件合并到一个大文件中。它一直运转良好。但是最近,对于一个特定的文件,我已经开始收到下面的错误。
java.io.IOException: Loop within object COSObject{2, 0}
at org.apache.pdfbox.multipdf.PDFCloneUtility.checkForRecursion(PDFCloneUtility.java:277)
at org.apache.pdfbox.multipdf.PDFCloneUtility.cloneForNewDocument(PDFClone
log4j:WARN No appenders could be found for logger (org.apache.pdfbox.util.PDFStreamEngine).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
Exception in thread "main" java.lang.NoSuchMethodError: org.
我有一个大部分已经完成的CodenameOne项目,我需要将桌面版本与PDFBox集成起来。我正在尝试打开一个文档并将页面呈现到我在应用程序中显示的图像。
我得到以下错误:
java.lang.NoClassDefFoundError: Could not initialize class org.apache.pdfbox.pdmodel.font.PDTrueTypeFont
at org.apache.pdfbox.pdmodel.font.PDFontFactory.createFont(PDFontFactory.java:100)
at org.apache.pdf
在尝试合并多个PDF文档时,我遇到以下错误...
PDFMerger failed with the following exception:
org.apache.pdfbox.exceptions.WrappedIOException
at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:278)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1220)
at org.apache.pdfbox.pdmodel.P
在我的java应用程序中,我使用pdfbox-2.0.9将PDF文件转换为html。但我得到了
java.lang.UnsupportedOperationException
at org.apache.pdfbox.pdmodel.graphics.color.PDPattern.toRGB(PDPattern.java:95)
at org.fit.pdfdom.PathDrawer.pdfColorToColor(PathDrawer.java:133)
at org.fit.pdfdom.PathDrawer.clearPathGraphics(PathDraw
我尝试从这个页面运行Pdfbox示例:,并从一个PDF文件中提取文本。当我尝试运行它时,我有错误:
org.apache.pdfbox.exceptions.WrappedIOException
at org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:245)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1192)
at org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.jav
我有一些pdf需要提取到文本,只有一个pdf是真实的类型,它会导致以下错误:
Exception in thread "main" java.lang.NoSuchMethodError: org.apache.fontbox.ttf.TrueTypeFont.getAdvanceWidth(I)I
at org.apache.pdfbox.pdmodel.font.PDTrueTypeFont.getFontWidth(PDTrueTypeFont.java:677)
at org.apache.pdfbox.pdmodel.font.PDSimpleFont.getFont
我有一个问题的软件打印PDF文件直接与默认打印机。有时,当用户打印PDF文件时,我会收到一个OutOfMemoryError,但我不知道问题出在哪里。
java.lang.OutOfMemoryError: Java heap space
at java.awt.image.DataBufferInt.<init>(Unknown Source)
at java.awt.image.Raster.createPackedRaster(Unknown Source)
at java.awt.image.DirectColorModel.createCom
我们使用PDFBOX合并两个PDF
文件1: 35 KB
档案2: 32 KB
合并时,我将得到错误的Expected scratch file size of 65536 but found 61440
我使用MemoryUsuageSetting使用tempfile进行合并,如
pdfMerger.mergeDocuments(MemoryUsageSetting.setupTempFileOnly());
下面是合并例程中的代码
List<InputStream> sources (inputsteam of my files to merge)
merged
我正在使用PDFBox从几个PDF文档中提取文本,在运行我的单元测试套件(通过gradle)时,我得到了由NullPointerException引起的间歇性故障--我现在的基本假设是,它是由试图同时将字体加载到字体字典缓存的多个线程造成的。
我知道,,PDFBox并不是threadsafe --但我从它和中得到的印象是,这与同时访问文档的多个线程特别相关,而且评论似乎表明,字体盒缓存应该是线程安全。
我在单元测试中遇到的例外是:
WARNING: Using fallback font 'LiberationSans-Bold' for 'Arial-BoldItal
当我调用PDField.setValue来设置表单字段的值时,我得到以下堆栈跟踪:
FileSystemFontProvider.saveDiskCache(349) | Could not write to font cache
java.io.FileNotFoundException: /.pdfbox.cache (Permission denied)
at java.io.FileOutputStream.open(Native Method)
at java.io.FileOutputStream.<init>(FileOutputStream.java:194)
at
我正在尝试用Java读取PDF文档。我对此很陌生,也对配置依赖关系w/ intelliJ也很陌生。完全错误是:
Exception in thread "main" java.lang.NoSuchMethodError: 'void org.apache.fontbox.cmap.CMapParser.<init>(boolean)'
at org.apache.pdfbox.pdmodel.font.CMapManager.parseCMap(CMapManager.java:74)
at org.apache.pdfbox.pd
我正在使用Apache进行pdf文件处理。
在本地运行它很好,我得到的错误是在AWS Lambda上执行代码。这是有意义的,因为pdfbox试图更新字体缓存,这在Lambda上是不可能的。
我得到以下错误信息:
Feb 20, 2017 3:22:19 PM org.apache.pdfbox.pdmodel.font.FileSystemFontProvider loadDiskCache
WARNING: New fonts found, font cache will be re-built
Feb 20, 2017 3:22:19 PM org.apache.pdfbox.pdmode
从PDF文档读取页面时出错。此页面包含用字体(AAAAAC+Code3de9)完成的条形码。只有在使用renderImage函数时才会出现此错误。
我使用了pdfbox-app的2.0.17版本。
*déc. 02, 2019 9:34:13 AM org.apache.pdfbox.pdmodel.font.PDCIDFontType2 <init>
AVERTISSEMENT: Could not read embedded OTF for font AAAAAC+Code3de9
java.io.IOException: Illegal seek position: 2483
我尝试了下面的代码来读取pdf:
val byteArrayOutPutStream: ByteArrayOutputStream = new ByteArrayOutputStream
val file = new File(path + name)
val inputStream = new FileInputStream(file)
val document = new PDFDocumentReader(inputStream)
var result: List[BufferedImage] = Nil
val numPgs = document
我已经使用PDFBox将pdf文件分割成图像已有一段时间了,但是在更新到2.0.19之后,我开始遇到意外的异常。
这是异常的堆栈跟踪:
java.lang.ArrayIndexOutOfBoundsException: 3
at java.awt.color.ICC_ColorSpace.toRGB(ICC_ColorSpace.java:191)
at org.apache.pdfbox.pdmodel.graphics.color.PDICCBased.toRGB(PDICCBased.java:350)
at org.apache.pdfbox.rendering
我开始熟悉PDFBox的口味了。我想知道是否有一种方法可以将pdf布局元素放到PDDocument对象中。pdf-布局元素使用文档作为父元素,PDFBox使用PDDocument作为父元素。
PDDodcument doc = new PDDocument();
Paragraph someText = new Paragraph();
Frame shape = new Frame(someText);
//Im looking for something like doc.add(shape);
使用的库:和
org.apache.pdfbox.pdmodel.PDDocument
在尝试从Apache PDFBox命令行工具中定位版本类时,我收到以下错误: $ java org.apache.pdfbox.tools.Version -cp pdfbox-tools-3.0.0-RC1.jar
Error: Could not find or load main class org.apache.pdfbox.tools.Version
Caused by: java.lang.NoClassDefFoundError: picocli/CommandLine$IVersionProvider 当以不同的方式运行时,也会收到此错误: $ java -jar pdfbo
我试图在powershell中运行pdfbox,但是我得到了错误:
java -jar .\pdfbox-2.0.14.jar ExtractText '.\TEST.PDF' out.txt
no main manifest attribute in pdfbox-2.0.14.jar
与pdfbox-tools-2.0.14.jar相同:
java -jar .\pdfbox-tools-2.0.14.jar ExtractText '.\TEST.PDF' out.txt
no main manifest attribute in pdfbox-tools