五年以前,研究人员在解读图像软件的准确性方面做出了一次意料之外但大幅度的飞跃,其背后的人工神经网络支撑了我们现在在AI行业所看到的繁荣景象。然而,我们还远没有达到类似电影《终结者》或《黑客帝国》中所描述的现实。
目前,研究人员正试图把重点放在教机器人如何将一件事情做到极致上面。不同于一次处理多个事物的人脑,机器人必须以线性方式“思考”。
不管怎样,在某些领域,AI确实能够打败人类。深度神经网络已经学会了交谈、驾驶汽车、打电子游戏、下围棋和画图,以及帮助探索科学发现。
在以下六个领域中,人工神经网络已经证明,它们可以超越人类的智慧。
1. 图像和物体识别
机器在图像和物体识别方面有着良好的记录。在一个识别玩具的软件测试挑战中,Geoff Hinton发明的Capsule网络刷新了以往的最佳错误率。即使视图与之前所分析的不同,在各种扫描中,这些网络也允许系统更好地识别物体。
另一个例子来自一个顶尖的网络,该网络经过标记图像数据库的训练,它能够比接受相同任务训练超过100个小时的博士生更好地进行物体分类。
2. 电子游戏
谷歌的DeepMind所使用的深度学习技术,被称为“深度强化学习”。研究人员用这种方法教计算机玩砖块游戏《Breakout》,他们并没有以任何特定的方式对电脑进行教学或编程。相反,在观看比分时计算机还被赋予了键盘的控制权,其目标是取得最高分。玩了两个小时后,计算机成了该游戏的专家。
深度学习社区正在进行一场比赛,训练计算机在几乎所有你能想到的游戏中击败人类,包括《太空侵略者》、《毁灭战士》、《PONG》和《魔兽世界》。在大多数游戏中,深度学习网络已经打败有经验的玩家。值得注意的是,电脑没有通过编程玩游戏,它们只是在玩的过程中学习。
3. 语音生成和识别
去年,谷歌发布了WaveNet,百度发布了Deep Speech。两者都是自动生成语音的深度学习网络。系统会学习模仿人类的声音,并随着时间的推移而改进。将它们生成的语音与真实的人物声音区别开来,要比想像中难得多。
由牛津大学和谷歌DeepMind科学家创建的一个深度网络 LipNet ,在阅读人们的唇语上达到了93%的准确率,而普通的人类唇语阅读器只有52%的正确率。此外,来自华盛顿大学的一个小组使用唇形同步创建了一个系统,将合成音频与现有视频实现同步。
4. 艺术品和风格的模仿
神经网络可以研究特定艺术品的笔触、颜色和阴影中的图案。在此基础上,还可以将原作的风格转化为新的形象。
DeepArt.io就是一个例子,该公司创建的应用程序使用深度学习来学习数百种不同的风格,你可以将其应用于你的照片中。艺术家和程序员Gene Kogan还根据从埃及象形文字中学到的算法样式,运用风格转换来修改蒙娜丽莎的画像。
5. 预测
斯坦福大学研究人员蒂姆尼特·格布鲁(Timnit Gebru)选取了五千万张谷歌街景图片,来探索一个深度学习网络可以做些什么。结果发现:计算机学会了本地化和识别汽车。它检测到超过2200万辆汽车,包括它们的制造商、型号、车型和年份。这个系统所获得的洞见之一就是,它能够监测选民路线开始和停止的轨迹。Gebru和他的合著者写道:“根据分析,如果在15分钟车程内遇到的轿车数量超过皮卡车数量,那么在下次总统选举期间,这个城市很可能会投票给民主党人(88%的几率)。”
另一个证明机器比人类提供更准确的预测的例子是来自谷歌Sunroof的项目。该技术使用来自谷歌地球的航空照片创建屋顶的3D模型,将其与周围的树木和阴影区分开来。然后使用太阳的轨迹,根据位置参数来预测你屋顶的太阳能电池板可以产生多少能量。
6. 网站设计修改
在网站生成器中集成的人工智能可以帮助网站更新,并对网站进行有用的修改,比人类更快速、更准确。这种系统的底层技术提供了普通用户对于网站外观的意见,来告诉设计师网站设计的好坏。如今,网站建设者要么使用深度网络来修改设计,要么计划在不久的将来使用它们。该技术可以根据以前的转换率和其他重要指标,分析不同的模式并创造更好的结果。
虽然我们可能仍然离实现矩阵级AI很遥远,但是各大企业正在努力提高神经网络的智能化水平。上面提到的这些项目只是这项技术的浅层次应用,新的想法和改进也将不断涌现,以证明机器能够在诸多领域超越人类。
领取专属 10元无门槛券
私享最新 技术干货