前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >验证码的故事 (1)

验证码的故事 (1)

作者头像
Crossin先生
发布于 2018-04-16 08:12:24
发布于 2018-04-16 08:12:24
7510
举报

老网民们大概都记得,刚开始上网的时候,是不存在验证码(captcha)这么一种东西的。这造成的结果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。

最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己的免费邮箱,恰恰又是垃圾邮件的最爱——耗费无数资源所阻止的垃圾邮件,都来自于自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。

互联网最早出现的captcha

他们找到一位当时刚刚21岁的天才——Luis Von Ahn。 而 Luis Von Ahn 给出的方案,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码 captcha。计算机辨识技术还很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些字符的,即为人类。

Luis Von Ahn

故事还没完,Luis Von Ahn 是那种追求完美的科学家。当全世界数以十亿计的人每天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的人脑智力是否能得到更好的应用呢?

Luis Von Ahn 的最终设计是,让人们用这些脑力解决一些计算机无法解决的图书数字化。

在计算机时代以前,印刷术已经存在了数百年,但这些印刷术所产生的书本和报纸等等,对于计算机来说都是模拟信号,仅以图像的形式存在,而非以数字化的形式存在。但是,早期的印刷术并不精确,文字大小不一,形象有差别。而且因为印刷品年代久远,拥有各种细微的缺损和污染。这对人眼来说不是什么大问题,但对计算机来说就麻烦了。

因此,2002年,Luis Von Ahn开始让 captcha 引用各种无法被计算机辨识的文字图像,目前,已经有上万网站采用他的新一代 captcha。每天帮助辨识数以百万计的古老文档。

问题在于,对于最初的 captcha 来说,计算机实际上是知道答案的。而 Luis 希望人们辨识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢?

解决这个问题的方法依然体现了 Luis 一贯的简洁和优美,他让人们每次辨识两个,而非一个 captcha,其中一个来自于计算机随机生成的字符串,而另一个则是从文档中选取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就判定,人们对后一个 captcha 的辨识是正确的。

目前在 google、yahoo、youtube 等各个网站都能看到的双 captcha,一个是需要辨认的文档图像,一个是计算机生成的 captcha

用这一方法,Luis 的 captcha 2.0 已经帮助完成了整个纽约时报130年的报纸存档数字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-01-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Crossin的编程教室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
阻碍你抢票的“罪魁祸首”竟然是他?
我们在使用互联网的过程中,可以看到网站往往会通过验证码来辨别用户是否是机器人,验证码实际上就是人类和计算机的一场战争。但有时候你会发现,验证码也是让人感到十分无奈,有的时候严重扭曲到不能通过人眼来识别。 随着电脑信息技术的飞速发展,有效图像识别技术已经被开发出来,但目前大部分网站使用的文本验证码还是有用的。尖端的图像识别技术需要花费大量时间金钱成本,黑客们是不会用它们来破解你的博客、窥探你中午打算吃什么的。只有那些涉及机密、金钱利益的网站,比如网上银行、购物网站等受到了较大的威胁。为了防止财产损失,这些网站
企鹅号小编
2018/01/23
8020
阻碍你抢票的“罪魁祸首”竟然是他?
验证码的故事 (2)
上次我们说到了路易斯·冯·安(Luis von Ahn)发明的,既能拦截网络垃圾 spam、又能顺便帮助进行古籍的数字化工作的验证码工具--reCAPTCHA。今天继续这个话题的后续故事。 reCAPTCHA 在 2009 年被 Google 收购。在其作为验证码本职工作之外,承担了数字化 Google Books 和 Google 新闻档案计划的部分任务。到了近两年,有很多使用 reCAPTCHA 服务的网站上,验证码的内容发生了变化:一半仍然是扭曲的单词,而另一半则是一张带有数字的照片。这其实是 Goo
Crossin先生
2018/04/16
1K0
谷歌收购的这家公司值多少钱?
大数据文摘编辑 如需转载,请后台留言申请 垃圾邮件危机 20世纪90年代后期,网络逐渐变得拥堵起来。有人开发了一款名为“Spambots”的垃圾邮件程序软件,向成千上万名用户批量发送广告信息,淹没收件人的电子邮箱。他们会在各种网站上注册,然后在评论部分留下成百上千条广告。网络因此成了一个不守规矩、不受欢迎、不够友善的地方。而且,这种软件似乎打破了网络原有的开放性和易用性模式,要知道,正是这种模式向人们提供了各种便利,比如免费电子邮件。当票务公司根据“先到先服务”的原则提供演唱会门票网上订票服务时,作弊软件
大数据文摘
2018/05/21
1.4K0
从技术角度看验证码是什么?
俗话说得好,“常在网上走,哪有不验证”。我们爱也好恨也罢,每天谁不抓耳挠腮输入几个验证码呢?
问题先森
2020/07/21
9060
烦人的验证码有什么用?技术难题全靠它!
你是不是要经常输入验证码?登录网站时输完密码,要输入一个单词或者几个歪歪扭扭不怎么好辨认的字母,这个场景一定不陌生?有没有思考为什么要输入验证码?验证码有什么作用?
问题先森
2020/07/24
1.7K0
Google 验证码进化史:我们越来越方便,但也交出了越来越多的隐私
即使现在互联网已经渗透到我们生活的方方面面,但它依然只是现实的物理世界在虚拟的网络空间上按比特信息编码后的投射。
猿哥
2019/07/15
1.3K0
Google 验证码进化史:我们越来越方便,但也交出了越来越多的隐私
身价7亿美元的41岁数学教授-路​易斯·冯·安
数学教授路易斯·冯·安(Luis Von Ahn),一位创建了验证码(CAPTCHA)和“多邻国”(Duolingo)。令人恐惧的天才。
银河1号
2020/06/23
1.2K0
当 AI 足够聪明时,我们的验证码还有用吗?
点击蓝字 关注我们 大家好,欢迎来到《不写代码也能看懂的风控安全系列》。 今天开启的“验证码风云录”专题将围绕一个课题展开,即探秘:“验证码为什么越做越简单了?” 在这一系列中,笔者将验证码的20年发展历程大致分为3大阶段: · 比谁更丑 → 图像对抗时代 → 本文揭秘 · 比谁更精 → 行为对抗时代 → 下篇预告 · 比谁更深 → 资源对抗时代 → 前沿报告 而本文将要带大家走近的,便是“比比谁更丑”的图像对抗时代。 全文4000字,阅读预计15分钟,喜欢你就赞我一下! 01 #前言:为什么会有
腾讯技术工程官方号
2021/08/23
7860
动态 | 验证码要凉凉?中国西北大学和北京大学的研究或将终结 CAPTCHA 验证码时代
在互联网上与人沟通时,你如何证明自己不是机器?这是一个很难的问题,多年以来的解决方案就是你能够成功读取一系列机器无法识别的扭曲字符。这种安全工具称为 CAPTCHA。
AI科技评论
2018/12/29
4380
动态 | 验证码要凉凉?中国西北大学和北京大学的研究或将终结 CAPTCHA 验证码时代
基于GAN的验证码识别工具,0.5秒宣告验证码死刑!
这是一个比较棘手的问题,多年来,这个问题的解决方案一直就是“验证码”,就是看看你能够能成功识别一系列机器无法识别的扭曲字符。这类安全验证工具被称为“CAPTCHA”(即“全自动区分机器和人类公共图灵测试”)。
新智元
2018/12/27
5750
基于GAN的验证码识别工具,0.5秒宣告验证码死刑!
验证码的未来:扒一扒reCAPTCHA的那些事
reCAPTCHA的诞生及意义 CMU(卡耐基梅隆大学)设计了一个名叫reCAPTCHA的强大系统,让电脑去向人类求助。具体做法是:将OCR(光学自动识别)软件无法识别的文字扫描图传给世界各大网站,用以替换原来的验证码图片;那些网站的用户在正确识别出这些文字之后,其答案便会被传回CMU。 reCAPTCHA是利用CAPTCHA的原理(CAPTCHA的中文全称是全自动区分计算机和人类的图灵测试),借助于人类大脑对难以识别的字符的辨别能力,进行对古旧书籍中难以被OCR识别的字符进行辨别的技术。也就是说,reCA
FB客服
2018/02/05
3.9K0
验证码的未来:扒一扒reCAPTCHA的那些事
如何使用 CAPTCHA 保护您的 WordPress 网站
除非您以前从未上网,否则您肯定会遇到过 CAPTCHA 测试——可能每个版本也是如此。 如果您曾经不得不在方框中输入波浪线、模糊的文本或单击网格中带有消防栓(或其他基本视觉效果)的每个图像,那么您已经通过了 CAPTCHA 测试。 这是保持 WordPress 网站安全的最基本且最有效的方法之一。 有了这么多可用的专用插件,确保您的网站安全,尤其是在黑客首先攻击的地方,比您想象的要简单。
星姮十织
2022/01/02
4.1K0
Laravel验证码
验证码 是防止恶意破解密码、刷票、论坛灌水、刷页的手段。验证码有 多种类型。 本项目中我们将使用图片验证码,其原理是让用户输入一个扭曲变形的图片上所显示的文字或数字,扭曲变形是为了避免被光学字符识别软件(OCR)自动辨识。由于计算机无法识别验证码的图片,所以回答出问题的用户就可以被认为是人类。
申霖
2020/11/23
1.7K0
天才创业者:4 年时间 Google 收购了他的 2 家公司
曾经有人问,科技创业的门槛有多高?仔细想一下,发现其实并没有门槛:可以说自己最懂 90 后,以创业者的身份炒作几个语不惊人死不休的观点,搏了眼球再说;也可以说自己虽然不懂技术但是有情怀,除了乔布斯无人再出其右——还是搏了眼球再说。 特别是面向消费类科技互联网市场的创业,非常好的体现了互联网“没人知道电脑后面是不是一只狗”这个典故的精神——没人知道一家公司背后的创业者究竟懂不懂他在做的事情,当然,除了炒作之外。 那些深谙技术产品开发,执行力超强且专注做事的科技创业者,才应该获得媒体的关注和报道。毕竟,科技产业
大数据文摘
2018/05/23
6460
PHP实现验证码功能
借用百度的解释:验证码这个词最早是在2002年由卡内基梅隆大学的路易斯·冯·安、Manuel Blum Nicholas J.Hopper以及IBM的John Langford所提出。卡内基梅隆大学曾试图申请此词使其成为注册商标, 但该申请于2008年4月21日被拒绝。一种常用的CAPTCHA测试是让用户输入一个扭曲变形的图片上所显示的文字或数字,扭曲变形是为了避免被光学字符识(OCR, Optical Character Recognition)之类的电脑程序自动辨识出图片上的文数字而失去效果。由于这个测试是由计算机来考人类,而不是标准图灵测试中那样由人类来考计算机,人们有时称CAPTCHA是一种反向图灵测试。
兔云小新LM
2020/05/19
2.6K0
laravel中如何实现验证码验证及使用
验证码 是防止恶意破解密码、刷票、论坛灌水、刷页的手段。验证码有 多种类型。 现在我给大家实现如何使用图片验证码,其原理是让用户输入一个扭曲变形的图片上所显示的文字或数字,扭曲变形是为了避免被光学字符识别软件(OCR)自动辨识。由于计算机无法识别验证码的图片,所以回答出问题的用户就可以被认为是人类。在这里$代表cmd命令行符号。
全栈程序员站长
2022/07/08
2.7K0
laravel中如何实现验证码验证及使用
谷歌验证系统玩儿隐身,用机器学习判断你是人还是机器
【新智元导读】 谷歌新的reCAPTCHA验证系统,没有挑战也没有复选框,通过结合“机器学习和针对最新威胁的先进风险分析”,就能无形中判断网站登录者是否人类。 谷歌的验证系统reCAPTCHA是网上最好的验证系统(CAPTCHA,CompletelyAutomated PublicTuring test to tell Computersand Humans Apart)。在网络注册页面上,你大概已经见过CAPTCHA不下一百万次了;为了证明你不是垃圾邮件机器人,你要接受一个挑战:辨认字词或数字的图片,挑选
新智元
2018/03/27
9570
验证码破解全流程实战
验证码,全称为“Completely Automated Public Turing test to tell Computers and Humans Apart”,即全自动区分计算机和人类的图灵测试,Captcha。早在上个世纪90年代,为了防止恶意的网络机器人行为,像邮件轰炸、暴力破解密码等,验证码应运而生。
TechLead
2023/10/21
2.3K0
验证码破解全流程实战
验证码,再见!利用机器学习在15分钟内破解验证码
每个人都讨厌验证码——只有输入了那些讨厌的图片上的文本,才能访问网站。验证码的设计是为了防止计算机自动填写表格,验证你是一个真实的“人”。但随着深度学习和计算机视觉的兴起,现在他们往往容易被击败。 我
AiTechYun
2018/03/05
1.3K0
验证码,再见!利用机器学习在15分钟内破解验证码
为了「理解」什么是对,人工智能还必须「理解」什么是不对
如今,计算机科学可以从汉斯事例学到很多。越来越多的研究表明,目前我们创造的绝大多数人工智能学习了足够知识,可以给出正确回答,但是,却没有真正理解信息。这就意味着人工智能很容易被欺骗。通过抗干扰研究,机器学习算法进一步得以改善。这个研究的代表人物,亦即文中提及的Ian Goodfellow 是前谷歌深度学习骨干研究人员之一,Bengio的得意弟子,已经加入OpenAI。 20世纪90年代初,德国驯马师和数学家Wilhelm von Osten 向世人宣布他的马可以做算术。几年来,Von Osten 遍游全国
镁客网
2018/05/28
5800
推荐阅读
相关推荐
阻碍你抢票的“罪魁祸首”竟然是他?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档