我被要求在线出版一本完整的书,就像Google Books做的那样?例如,它是可查看和可打印的,但不能下载。
这个过程基本上是“高质量扫描”吗?在这些高质量的图像上,是否有任何开源的解决方案来“大规模生成”“水印”?假设你有一张原始图片。当用户在线查看它时,我重新创建了图像并在图像" on - the -fly“上添加了水印和其他一些文本。python中是否存在这样的库?
有什么建议吗?如果你以前这样做过,请分享。
谢谢
我有一个100+手写页面的pdf格式,我需要转换为机器可读的文本。到目前为止,我已经尝试了tesseract和一个免费的在线工具,但没有成功。结果似乎是胡言乱语。
tesseract myscan.png out -l eng
我已经附上了一个示例页面。它包含文本、数学符号(例如,整数符号)和偶尔的图片。
也许我用错了tesseract?有没有人能试着从这上面得到一个好的输出呢?
我有一个wordpress的网站,当我在谷歌上列出搜索结果时,我会看到很多垃圾搜索结果,比如: Cialis正在打折,-Buy -Canadian Extra Super Viagra --接受ACH --购买额外的链接,这些链接在wordpress中并不存在,如果我点击它们,结果就找不到了。我该如何确定是什么导致了这样的结果?我使用的是付费模板,所以它应该是安全的。(理论上)
谢谢