中的图片和图表可能在文字上方或下方, 或使用透明和裁剪, 转换器必须决定图片是页面背景的一部分还是内嵌对象, 错误判断会把图片移离相关文字或把图片切成碎片, 扫描的 pdf 更难处理, 因为它们是文字的图片..., 因为转换器误读了阅读顺序, 我用磨针工具软件 修表格时的提示很直白, 没什么花哨的词儿,
隐藏结构和扫描文档
有些 pdf 来源于专业工具并包含描述标题和阅读顺序的隐藏标签, 使用这些标签的转换器效果更好...的转换器, 并准备编辑输出, 如果你有具体的 pdf 我可以给出分步建议....常见问题(FAQ)
任何工具都能完美转换 pdf 吗
不能, 有些工具在带标签或简单布局的 pdf 上表现更好, 复杂页面, 大量图形或扫描件很少能在不人工修复的情况下完美转换.
...为什么单词会被拆分或出现多余空格
因为有些 pdf 为了控制布局把字符单独放置, 转换器在解释这些分离片段为单词或行时可能插入空格或换行.