Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >学界 | Vicarious发表Science论文:概率生成模型超越神经网络

学界 | Vicarious发表Science论文:概率生成模型超越神经网络

作者头像
机器之心
发布于 2018-05-10 02:56:50
发布于 2018-05-10 02:56:50
7300
举报
文章被收录于专栏:机器之心机器之心

选自Science

作者:D. George等

机器之心编译

参与:蒋思源

当前人工智能的兴起主要基于深度学习的发展,但是这种方法并不能让计算机像人类一样通过学习少量样本就能将知识泛化到很多种问题中去,这也意味着系统应用范围受限。最近,知名人工智能创业公司 Vicarious 在 Science 上发表的研究提出了一种全新概率生成模型。新的模型具有识别、分割和推理能力,在场景文字识别等任务上超过了深度神经网络。研究人员称,这种方法或许会将我们带向通用人工智能。

论文:A generative vision model that trains with high data efficiency and breaks text-based CAPTCHAs

论文链接:http://science.sciencemag.org/content/early/2017/10/25/science.aag2612

摘要:从少数样本学习并泛化至截然不同的情况是人类视觉智能所拥有的能力,这种能力尚未被先进的机器学习模型所学习到。通过系统神经科学的启示,我们引入了视觉的概率生成模型,其中基于消息传送(message-passing)的推断以统一的方式处理识别、分割和推理(Reasoning)。该模型表现出优秀的泛化和遮挡推理(occlusion-reasoning)能力,并在困难的场景文字识别基准任务上优于深度神经网络,且更具有 300 倍的数据效率(data efficient)优势。此外,该模型基本上打破了现代基于文本的验证码生成方案,即在没有具体验证码的启发式方法下分割目标。我们的模型在通向通用人工智能的路上可能是非常重要的,因为它强调了数据效率和语意合成性等特性。

图 1:人类在字母形式感知上的灵活性。(A)人类擅长解析不熟悉的验证码。(B)相同的字母可以有非常多的表现形式,上图都是「A」。(C)对形状的感知可以有助于将其解析为相近的目标。

图 2:RCN(Recursive Cortical Network)的结构。

上图(A)层级结构生成对象的轮廓,条件随机场(CRF)生成表面外观。(B)轮廓层级相同的两个子网络通过复制特定父结点的子结点特征并连接它们到该父结点的旁边分支(laterals)而保持独立的分支连接。图中绿色矩形的结点是特征「e」的复制。(C)表征正方形轮廓的三级 RCN,第二级特征表征着四个角,而每个角都使用四个线段的连接表示。(D)表征字母「A」的四级网络。

图 4:传播与特征学习的过程。

上图(A)中的 i 为前向传播(包括了侧面传播),生成多个字母的假设展示在输入图像中。PreProc 是一组类 Gabor 的滤波器,可以将像素转化为边缘似然度。ii 为后向传播和侧面传播(lateral propagation)创建的分割掩码,它可用来挑选前向传播的假设,上图掩码为「A」。iii 是错误的假设「V」正好拟合「A」和「K」的交叉点,错误的假设需要通过解析来解决。(iv)可以激活多个假设以产生联合解释来避免字母遮挡情况。(B)第二级特征上学习各种特征。彩色的圆圈表示特征激活,虚线圆圈表示提出的特征。(C)从轮廓领域学习边缘(laterals)。

图 5:用 RCN 解析验证码。

上图(A)为代表性的 ReCAPTCHA 解析方法所给出的前两个预测结果,它们的分割与标注由两个不同的标注者完成。(B)在受限的 CAPTCHA 数据集上 RCN 和 CNN 的词准率。在修改字符间距后,CNN 相比于 RCN 没有那么多的鲁棒性。(C)为不同 CAPTCHA 风格的准确率。(D)为代表性 BotDetect 解析和分割结果(使用不同颜色表示)。

图 6:使用少量样本进行训练的 MNIST 分类结果。

上图(A)为 RCN、CNN 和 CPM 的 MNIST 分类准确度。(B)为有损 MNIST 测试集上的分类准确度,图例展示了训练样本的总数。(C)为不同 RCN 配置的的 MNIST 分类准确度。

图 7:通过 RCN 生成、遮挡推理和场景文字解析。

本文为机器之心编译,转载请联系本公众号获得授权。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-10-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
人工智能、人工神经网络、机器学习、深度学习、强化学习及大语言模型这六者之间的联系与区别
结语:人工智能技术体系如同一棵大树,机器学习是主干,深度学习与强化学习是主要分支,而大语言模型则是当前最茂盛的果实。理解其关联与差异,方能灵活选用工具,解决现实问题。
zzh-dahai
2025/07/15
3870
【Science】超越深度学习300倍, Vicarious发布生成视觉模型,LeCun批“这就是AI炒作的教科书”
【新智元导读】最近大家都在探索“超越深度学习”的方法,“美国版DeepMind” Vicarious 近日在Science上发布的一项研究,使用不同于深度学习的方法,将数据使用效率提升了300多倍,“对于未来的通用人工智能有重要意义”。该研究称,使用这种新的技术,他们攻破了网站常见的验证码防御,相当于通过了“反向图灵测试”。LeCun对这家公司和他们的研究提出了尖锐的批评,说“这是AI炒作教科书式的例子”。不过,支持Vicarious 的人可不少:马斯克、扎克伯格和贝佐斯都是其投资人。 总部位于旧金山的人工
新智元
2018/03/21
9430
【Science】超越深度学习300倍, Vicarious发布生成视觉模型,LeCun批“这就是AI炒作的教科书”
CAPTCHAs验证码被人工智能攻破
据《科学》(Science)杂志2017年10月报道,一家名为Vicarious的人工智能公司开发的人工智能算法攻破了被人们广泛使用的CAPTCHAs验证码。 CAPTCHAs(Completely Automated Public Turing Test To Tell Computers and Humans Apart,全自动区分计算机和人类的图灵测试)是目前最常用的一种验证码,通常由一组混乱的字符、波浪线和其他背景噪声组成。例如,在你报名参加一个时事通讯或购买音乐会门票之前,可能会被要求输入这些字符
人工智能快报
2018/03/15
8460
CAPTCHAs验证码被人工智能攻破
在大家热议Vicarious AI那篇Science论文时,我们和这家公司的CTO聊了聊(回应LeCun批判)
机器之心原创 作者:彭君韬(Tony) 上周,Vicarious AI 发表在 Science 上的一篇论文引发了业内热议,有褒有贬,甚至有媒体挖出了 Yann LeCun 2013 年对 Vicar
机器之心
2018/05/10
9440
1+1>2:MIT&IBM提出结合符号主义和连接主义的高效、准确新模型
人工智能应该复制人脑的哪一部分功能?这个问题的答案反映了一场辩论的焦点,这场辩论和 AI 的历史一样久远。20 世纪 50 年代,人类开始探索如何创建可以思考的机器,也是从那时候起,AI 领域的研究和发展之路陷入了分歧:符号主义和连接主义 AI 应如何取舍?
机器之心
2019/06/14
1.3K0
1+1>2:MIT&IBM提出结合符号主义和连接主义的高效、准确新模型
学界 | 超少量数据训练神经网络:IEEE论文提出径向变换实现图像增强
选自arXiv 机器之心编译 参与:李亚洲、黄小天 近日,一篇题为《Training Neural Networks with Very Little Data-A Draft》IEEE 论文提出了一
机器之心
2018/05/08
1.1K0
学界 | 超少量数据训练神经网络:IEEE论文提出径向变换实现图像增强
神经网络并不是尚方宝剑,我们需要正视深度 NLP 模型的泛化问题
AI 科技评论按:前段时间的文章《顶会见闻系列:ACL 2018,在更具挑战的环境下理解数据表征及方法评价》中,我们介绍了 ACL 大会上展现出的 NLP 领域的最新研究风向和值得关注的新进展。从这些新动向上我们似乎应该对深度学习 NLP 解决方案的表现充满信心,但是当我们真的仔细讨论 NLP 模型的泛化能力时候,状况其实并不乐观。
AI科技评论
2018/09/21
4140
神经网络并不是尚方宝剑,我们需要正视深度 NLP 模型的泛化问题
学界 | 同济大学综述论文:基于深度生成模型的药物研发
论文:Advances and challenges in deep generative models for de novo molecule generation
机器之心
2018/12/11
8360
学界 | 同济大学综述论文:基于深度生成模型的药物研发
终于,Geoffrey Hinton那篇备受关注的Capsule论文公开了
Geoffrey Hinton 等人备受关注的 NIPS 2017 论文《Dynamic Routing Between Capsules》已于数小时前公开。 9 月份,Axios 的一篇报道指出,Geoffrey Hinton 呼吁研究者们对反向传播保持怀疑态度,并准备在深度学习之上重构人工智能的理论体系。报道指出,他和其他两位研究者被 NIPS 2017 接收的论文《Dynamic Routing Between Capsules》正是 Hinton 对于未来人工智能形态的新探索。 在论文未放出之前,业
IT派
2018/03/28
8630
终于,Geoffrey Hinton那篇备受关注的Capsule论文公开了
自动「脑补」3D环境!DeepMind最新Science论文提出生成查询网络GQN
作者:S. M. Ali Eslami、Danilo Jimenez Rezende
机器之心
2018/07/30
4150
自动「脑补」3D环境!DeepMind最新Science论文提出生成查询网络GQN
学界 | 为数据集自动生成神经网络:普林斯顿大学提出NeST
选自arXiv 机器之心编译 参与:李亚洲、李泽南 普林斯顿大学最近提出的 NeST 方法从新的角度为神经网络优化打开了方向。研究人员提出的新技术可以用「种子」神经网络为基础,对特定数据集自动生成最优化的神经网络,这些生成的模型在性能上超过此前业内最佳水平,同时资源消耗与模型尺寸相比同类模型小了一个数量级。研究人员称,NeST 方法在工作过程中与人类大脑的成长和处理任务方式非常相近。 过去十几年,神经网络变革了大量的研究领域,例如计算机视觉、语音识别、机器人控制等。神经网络通过多层抽象从数据集中提取智能的能
机器之心
2018/05/10
1.2K0
张钹院士:AI科学突破的前夜,教授们应当看到什么?
文章主要讨论了人工智能(AI)在医疗领域的应用,包括诊断、手术、预防等方面。作者认为,AI 技术在未来将发挥更大的作用,并呼吁更多科研工作者投身该领域。
企鹅号小编
2018/01/04
7000
张钹院士:AI科学突破的前夜,教授们应当看到什么?
用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究
DNN 已经可以这么玩了?不论计算机视觉还是 NLP,深度神经网络(DNN)是如今我们完成机器学习任务的首选方法。在基于此构建的模型中,我们都需要对模型权重执行某种变换,但执行该过程的最佳方法是什么?
计算机视觉研究院
2023/08/22
2530
用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究
卷积神经网络(CNN)
假设给定一张图(可能是字母X或者字母O),通过CNN即可识别出是X还是O,如下图所示
CristianoC
2020/05/31
9730
卷积神经网络(CNN)
学界 | 正在涌现的新型神经网络模型:优于生成对抗网络
选自Medium 作者:Alfredo Canziani等人 机器之心编译 参与:黄小天、吴攀 随着深度神经网络技术的发展,新型的网络架构也在不断涌现。普渡大学 e-Lab 的三位研究者 Alfredo Canziani、Abishek Chaurasia 和 Eugenio Culurciello 近日在 Medium 上发文阐述了一类新型的深度神经网络,其在视频分析上具有无监督学习 、分割、场景解析、定位、时空表征、视频预测、表征预测、在线学习等能力,并且还在很多方面优于当前大热的生成对抗网络(GAN)
机器之心
2018/05/08
1.5K0
学界 | 正在涌现的新型神经网络模型:优于生成对抗网络
学界 | 谁来拯救集体失灵的NLP模型?
机器能够像人类一样阅读文档并回答问题,确定某一给定的语句是否在语义上蕴含另一给定的语句,还能处理翻译任务。更重要的是,机器的表现甚至优于人类。
大数据文摘
2018/10/18
7470
稀疏&集成的卷积神经网络学习
今天主要和大家说的是分类检测过程中,一些稀疏和集成学习的相关知识,首先和大家说下图像目标定位与检测的方法分类。 众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载
计算机视觉研究院
2018/04/17
8930
稀疏&集成的卷积神经网络学习
深度学习、神经网络与卷积神经网络:研究及应用
在如今的网络时代,错综复杂的大数据和网络环境,让传统信息处理理论、人工智能与人工神经网络都面临巨大的挑战。近些年,深度学习逐渐走进人们的视线,通过深度学习解决若干问题的案例越来越多。一些传统的图像处理技术也可以通过深度学习来获得更优异的效果,比如去噪、超分辨率和跟踪算法等。为了跟上时代的步伐,必须对深度学习与神经网络技术有所学习和研究。
算法进阶
2024/04/12
6060
深度学习、神经网络与卷积神经网络:研究及应用
深度神经网络全面概述:从基本概念到实际模型和硬件基础
选自arxiv 作者:Joel Emer等 机器之心编译 深度神经网络(DNN)所代表的人工智能技术被认为是这一次技术变革的基石(之一)。近日,由 IEEE Fellow Joel Emer 领导的一个团队发布了一篇题为《深度神经网络的有效处理:教程和调研(Efficient Processing of Deep Neural Networks: A Tutorial and Survey)》的综述论文,从算法、模型、硬件和架构等多个角度对深度神经网络进行了较为全面的梳理和总结。鉴于该论文的篇幅较长,机器之
机器之心
2018/05/07
5.5K0
深度神经网络全面概述:从基本概念到实际模型和硬件基础
仅需15分钟,使用OpenCV+Keras轻松破解验证码
选自Medium 作者:Adam Geitgey 参与:李泽南、蒋思源 登录网站时必须输入的图片验证码可以用来识别访问者到底是人还是机器——这同时也是某种程度上的「图灵测试」,人工智能研究者们寻求破解的方向,让计算机学会破解验证码,我们就距离通用智能更近了一步(前不久 Vicarious 发表在 Science 上的论文就介绍了一种用于破解图片验证码的机器学习新模型)。今天,破解全世界最为流行的图片验证码需要多久?本文作者 Adam Geitgey 告诉你:仅需 15 分钟。 每个人都讨厌 CAPTCHA—
企鹅号小编
2018/03/05
1.1K0
仅需15分钟,使用OpenCV+Keras轻松破解验证码
推荐阅读
人工智能、人工神经网络、机器学习、深度学习、强化学习及大语言模型这六者之间的联系与区别
3870
【Science】超越深度学习300倍, Vicarious发布生成视觉模型,LeCun批“这就是AI炒作的教科书”
9430
CAPTCHAs验证码被人工智能攻破
8460
在大家热议Vicarious AI那篇Science论文时,我们和这家公司的CTO聊了聊(回应LeCun批判)
9440
1+1>2:MIT&IBM提出结合符号主义和连接主义的高效、准确新模型
1.3K0
学界 | 超少量数据训练神经网络:IEEE论文提出径向变换实现图像增强
1.1K0
神经网络并不是尚方宝剑,我们需要正视深度 NLP 模型的泛化问题
4140
学界 | 同济大学综述论文:基于深度生成模型的药物研发
8360
终于,Geoffrey Hinton那篇备受关注的Capsule论文公开了
8630
自动「脑补」3D环境!DeepMind最新Science论文提出生成查询网络GQN
4150
学界 | 为数据集自动生成神经网络:普林斯顿大学提出NeST
1.2K0
张钹院士:AI科学突破的前夜,教授们应当看到什么?
7000
用别的模型权重训练神经网络,改神经元不影响输出:英伟达神奇研究
2530
卷积神经网络(CNN)
9730
学界 | 正在涌现的新型神经网络模型:优于生成对抗网络
1.5K0
学界 | 谁来拯救集体失灵的NLP模型?
7470
稀疏&集成的卷积神经网络学习
8930
深度学习、神经网络与卷积神经网络:研究及应用
6060
深度神经网络全面概述:从基本概念到实际模型和硬件基础
5.5K0
仅需15分钟,使用OpenCV+Keras轻松破解验证码
1.1K0
相关推荐
人工智能、人工神经网络、机器学习、深度学习、强化学习及大语言模型这六者之间的联系与区别
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档