FineReader Engine Java SDK是一款由ABBYY开发的用于文字识别和文档转换的软件开发工具包。它提供了丰富的API和功能,可以帮助开发人员将PDF文档转换为可编辑的DOCX格式,并且可以在转换过程中选择忽略图片。
在使用FineReader Engine Java SDK进行PDF到DOCX转换时,可以通过以下步骤来忽略图片:
// 创建FineReader Engine实例
Engine engine = Engine.GetEngine();
// 加载PDF文档
Document document = engine.CreateFRDocument();
document.AddImageFile(imageFilePath, null, null);
// 创建转换参数
ExportParams exportParams = new ExportParams();
// 设置转换格式为DOCX
exportParams.setFormat(Format.DOCX);
// 设置忽略图片选项
exportParams.setRecognitionParams(new RecognitionParams());
exportParams.getRecognitionParams().setImageExportMode(ImageExportMode.None);
// 执行转换
document.Export(filePath, exportParams);
通过以上步骤,使用FineReader Engine Java SDK可以实现在PDF到DOCX转换过程中忽略图片。这样转换后的DOCX文件将不包含原始PDF中的图片。
推荐的腾讯云相关产品:腾讯云OCR文字识别服务。该服务提供了强大的OCR文字识别功能,可以帮助开发人员快速实现文字识别和文档转换的需求。详情请参考腾讯云OCR文字识别服务的产品介绍:腾讯云OCR文字识别。
领取专属 10元无门槛券
手把手带您无忧上云