我有一个100+手写页面的pdf格式,我需要转换为机器可读的文本。到目前为止,我已经尝试了tesseract和一个免费的在线工具,但没有成功。结果似乎是胡言乱语。
tesseract myscan.png out -l eng
我已经附上了一个示例页面。它包含文本、数学符号(例如,整数符号)和偶尔的图片。
也许我用错了tesseract?有没有人能试着从这上面得到一个好的输出呢?
所以我开始用C编写代码,我发现了一个错误,我不知道为什么发生在我身上://变量
#include <stdio.h>
int main () {
int x;
printf ("Add a value to variable 'x': ");
scanf ("i%", &x);
printf ("'x' = %i.\n", x);
system ("pause");
return 0;
}
当我编译它时,它只告诉我,无论我以前分配给它什么值,X的值都是0。
我正在尝试查找div中的图像位置
我的Html
<div>
<p>test</p>
<img src='test1.jpg'/>
<p>test</p>
<p>test</p>
<img src='test2.jpg'/>
<p>test</p>
<img src='test2.jpg'/> --the user clicks this image and I w