Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >如何提高节点JS和Tesseract.js的OCR精度?

如何提高节点JS和Tesseract.js的OCR精度?
EN

Stack Overflow用户
提问于 2021-01-12 07:45:13
回答 2查看 1.9K关注 0票数 0

我使用tesseract.js来检测Node中的数字。例如,这就是我的形象:

我运行我的脚本,它检测到这样的东西:

289 ,0

由于图像中的噪声,它考虑了空间,其他符号,如逗号等。

我是否可以指定,只指定数字,没有其他像空格和逗号这样的符号

这也是我的代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tesseract.recognize(
    __dirname + '/Captcha.png',
    'eng',
    { logger: m => console.log(m) }
).then(({ data: { text } }) => {
    console.log(text);
});
EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2021-01-12 07:51:51

我并不是没有js tesseract API,但是似乎有一个非常简单的工作--在这里使用过滤器之后:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
tesseract.recognize(
    __dirname + '/Captcha.png',
    'eng',
    { logger: m => console.log(m) }
).then(({ data: { text } }) => {
    const filteredText = Array.from(text.matchAll(/\d/g)).join("")
    console.log(filteredText)
})

下面是对过滤函数的测试:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
if (Array.from("209, 1".matchAll(/\d/g)).join("") !== "2091") {
  throw("Not working")
}

票数 0
EN

Stack Overflow用户

发布于 2021-03-09 10:18:24

我刚开始学习tesseract.js的内部人员来完成一个任务。

API文档解释了如何在午餐作业时使用一些参数来实现您想要的结果:tessedit_char_whitelist (设置白色列表字符使结果只包含这些字符) preserve_interword_spaces (保持单词之间的空格)来自https://github.com/naptha/tesseract.js/blob/master/docs/examples.md

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
const { createWorker } = require('tesseract.js'); 
const worker = createWorker();

(async () => {
  await worker.load();
  await worker.loadLanguage('eng');
  await worker.initialize('eng');
  await worker.setParameters({
    tessedit_char_whitelist: '0123456789',
    preserve_interword_spaces: '0',
  });
  const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png');
  console.log(text);
  await worker.terminate();
})();
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65687240

复制
相关文章
一款让OCR识别正确率趋近100%的库
Tesseract.js 一个 纯Javascript编程语言的 ocr 识别库,简单实用。
程序员老鱼
2022/12/02
3.3K0
我不信,这个项目 OCR 识别准确率居然能这么高!
Tesseract.js是基于Tesseract的一个纯 Javascript 编程语言的 ocr 识别库,简单实用。支持包括中英文等100多种语言(包括中文)的图片和视频文字识别,自动文本方向和脚本检测,用于读取段落,单词和字符边界框的简单界面,底层封装了Tesseract OCR引擎来实现。
永恒君
2022/12/07
2.3K0
我不信,这个项目 OCR 识别准确率居然能这么高!
提高回归模型精度的技巧总结
在这篇文章中,我们将看到如何处理回归问题,以及如何通过使用特征转换、特征工程、聚类、增强算法等概念来提高机器学习模型的准确性。
deephub
2021/07/01
1.9K0
前端技术观察第13期 - 2019 年前端性能检查清单
《前端技术观察》是由字节跳动IES前端团队收集、整理、推荐的业界高品质前端资源合集,主要分为以下几个板块: Highlights 优秀的工具、库 好的教程、深度解读已有技术的文章 业界最新的技术、热点文章 业界对(新)技术的深度地、优秀地实践 Tutorial Tools And Codes 《前端技术观察》的目的是让大家: 更及时的了解到业界最新的技术 受益于高质量的教程、文章 了解业界更优秀的代码、工具 更多地、氛围更浓厚地讨论、研究、落地技术 highlights 2019 年 CSS 发展现状(英)
ConardLi
2020/02/12
9680
前端技术观察第13期 - 2019 年前端性能检查清单
图插值激活提高数据高效深度学习的自然精度和鲁棒精度
原文标题:Graph Interpolating Activation Improves Both Natural and Robust Accuracies in Data-Efficient Deep Learning
Jarvis Cocker
2019/07/17
6140
Node.js识别图片验证码
当我们使用无头浏览器做自动化爬虫时经常会处理到一些表单的自动填写,被爬取的网站当然也少不了验证码过滤,目前Web端常用的还是传统的图片验证码。我这里讲解一个Node.js识别图片验证码的Demo,是我在内蒙古高考报名志愿时候需要时候自动填写验证码时候做的测试。
用户6256742
2022/07/06
4K0
Node.js识别图片验证码
js插入节点appendChild和insertBefore
首先 从定义来理解 这两个方法:  appendChild() 方法:可向节点的子节点列表的末尾添加新的子节点。语法:appendChild(newchild)  insertBefore() 方法:可在已有的子节点前插入一个新的子节点。语法 :insertBefore(newchild,refchild)  相同之处:插入子节点  不同之处:实现原理方法不同。       appendChild方法是在父级节点中的子节点的末尾添加新的节点(相对于父级节点 来说)。       insertBefore 方
蓓蕾心晴
2018/04/12
3K0
那些你可能不知道的 ocr 图片文字识别工具
有时候网上看到一张图片,比如电影截图,里面有台词,想把台词复制出来,这时候你可能会照着图片中的文字,手动打出来,但如果文字太多或者一篇文章,这样你会崩溃的,这时候你就需要ocr了。
苏生不惑
2019/08/17
10.2K1
如何删除渲染阻止JS 和 CSS以提高网站速度
虽然网站的美感很重要,但它的内容和加载速度会让人们回访。WordPress 为用户提供了一个复杂的插件和主题工具箱,可以快速创建他们自己的自定义网站。
小颖club
2022/04/10
3.1K0
JS数字精度丢失的问题
1. toFixed() 因为toFixed() 进行并转换之后是string类型的,需要在进行强制Number() 转换
愤怒的小鸟
2020/12/29
7K0
js精度丢失坑
我们定义一个简单接口,这里用com.baomidou.mybatisplus.core.toolkit.IdWorker.getId()生成19位为Long类型的id
阿超
2022/08/16
2.3K0
js精度丢失坑
双精度,单精度和半精度
浮点数是计算机上最常用的数据类型之一,有些语言甚至数值只有浮点型(Perl,Lua同学别跑,说的就是你)。
用户1148523
2019/05/27
6K0
【说站】js中insert如何插入节点
以上就是js中insert插入节点的方法,希望对大家有所帮助。更多js学习指路:js教程
很酷的站长
2022/11/24
2.8K0
【说站】js中insert如何插入节点
OCR material
End-to-End Text Recognition with Convolutional Neural Networks
bear_fish
2018/09/19
11.8K0
OCR material
使用哪些指令可以提高加工精度?
使用“G41\G42\G40刀尖圆弧半径补偿”功能。如图所示,实际加工中的车刀刀尖不是理想的尖锐刀尖,它总有个小圆弧,刀具磨损还会改变圆角半径。数控车削轮廓时实际起作用的切削刃是圆弧的各切点,编程时却是根据理论刀尖(假想刀尖)A轨迹计算、编程,因此会产生加工误差。
lrglu
2022/05/16
5420
使用哪些指令可以提高加工精度?
WASM·技术趋势
今天看到一则故事,一名程序员@Andreas Kling 辞掉工作,全职开发操作系统。正如其签名档一样:I like computers! 对技术的热爱已经超越了工作本身,完全是兴趣所在
mixlab
2021/10/12
1.7K0
js float运算精度问题
先放个前辈的文章:JavaScript数字精度丢失问题总结 今天遇到了19.99*100的问题,答案不等于1999,因为在javascript中浮点数的计算是以2进制计算的。自己写了一波解决方法(不能单纯的乘Math.pow(10,N)变成整数运算完再除掉,因为乘也会有精度问题,就像题面19.99*100不等于1999。): function formatFloat(num1,num2){ var str1 = num1.toString(); var str2 = num2.toStrin
mcq
2018/06/27
9.7K2
JS示例19-如何读取子节点
1、childNodes读取元素子节点 2、根据nodeType == 1 判断是元素节点(文本节点为3)
专注APP开发
2019/11/07
4.4K0
JS示例19-如何读取子节点
IoU-aware的目标检测,显著提高定位精度
今天新出的一篇论文IoU-aware Single-stage Object Detector for Accurate Localization,提出一种非常简单的目标检测定位改进方法,通过预测目标候选包围框与真实目标标注的IoU(交并比),并基于此与分类分数的乘积作为检测置信度,用于NMS(非极大抑制)和COCO AP计算,显著提高了目标检测的定位精度。
CV君
2019/12/27
1.2K0
点击加载更多

相似问题

如何提高tesseract.js的精度?

16

提高扫描文档的OCR精度

13

将图像传递给Tesseract.js OCR

27

如何提高此图像中的OCR精度?

122

运行tesseract.js OCR onFileUpload并提取文本

111
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文