前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Node.js识别图片验证码

Node.js识别图片验证码

作者头像
用户6256742
发布2022-07-06 14:59:19
发布2022-07-06 14:59:19
4K00
代码可运行
举报
文章被收录于专栏:网络日志网络日志
运行总次数:0
代码可运行

当我们使用无头浏览器做自动化爬虫时经常会处理到一些表单的自动填写,被爬取的网站当然也少不了验证码过滤,目前Web端常用的还是传统的图片验证码。我这里讲解一个Node.js识别图片验证码的Demo,是我在内蒙古高考报名志愿时候需要时候自动填写验证码时候做的测试。

环境安装

首先我们需要安装由Google开源的tesseract文字识别程序,下载地址,我用的是tesseract-ocr-setup-4.00.00dev.exe,下载后进行安装,直接一路Next就行,然后记住安装路径设置一下环境变量

Windows搜索框搜索:查看高级系统设置,点击环境变量,设置名称为TESSDATA_PREFIX的环境变量值为安装后的路径下面的tessdata文件夹

程序编写

我们使用tesseract.js插件来进行简单的图片验证码读取。可以读取本地的图片或者公网的图片。

图片地址:报名验证码地址

代码语言:javascript
代码运行次数:0
运行
复制
let Tesseract = require("tesseract.js")
Tesseract.recognize(
    'https://www1.nm.zsks.cn/kscx/public/addcode.do',
    'eng', {
        logger: m => console.log(m)
    }
).then(({
    data: {
        text
    }
}) => {
    console.log(text);
})
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 环境安装
  • 程序编写
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档