,奇怪的字体,以及错位的列,这是因为 pdf 注重固定布局,而 word 使用流式文本,转换工具试图解释 pdf 的布局并将其重建为可编辑内容,当 pdf 使用复杂格式,非标准字体,或者内容采用绝对定位而非逻辑阅读顺序时...,表格崩塌,单元格合并或列错位使数字和标签不对齐,项目符号和编号列表丢失层级变成普通文本....如何改善转换结果
选择好的转换器,付费工具和新版办公套件通常比免费或旧版转换器效果好,仅在必要时使用 ocr,如果 pdf 是扫描件,使用光学字符识别然后仔细校对,创建 pdf 时尽量嵌入字体或导出时包含字体...常见问题(FAQ)
为什么段落在转换后分成很多短行
转换器保留了硬换行或试图匹配 pdf 的精确位置,word 将这些视为独立行,在 word 中删除硬换行或重新流式排版即可解决.
...是否总要用 ocr 进行转换
只有当 pdf 是没有可选文本的扫描图像时才需要 ocr,ocr 会把图像中的文字变成可编辑字符,但可能产生识别错误需校对.