首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

《人工智能》——人工智能的前世今生(二)

本篇文章将完成对人工智能前世今生的介绍,并且唐三将尝试从这些信息推导出一些结论,希望能在大家使用人工智能时起到帮助作用。结论将在文章最后给出,感兴趣的读者可以直接拉到结尾直接阅读。

有位朋友打赏希望我能介绍下区块链是什么,我大约会在最近的2-3篇文章中完成一篇关于区块链是什么的科普,内容会参照这篇知乎回答 https://www.zhihu.com/question/37290469/answer/107612456,用更精简的语言进行介绍。如果有心急的同学,可以先行阅读这个链接。

人工智能的过去(续)

技术层,人工智能有四个技术方向,计算机视觉、语音技术、自然语言处理和规划决策系统。

计算机视觉,从七八十年代出现萌芽,人们尝试让计算机回答它看到了什么,这一阶段的技术主要应用于光学字符识别、工件识别等场景。到了90年代,由于GPU等图像处理硬件的进步,再加上人们通过规则特征的方法帮助机器理解图像(比如:猫有四条腿、尖耳朵这种),计算机视觉技术广泛被工业领域所应用。进入21世纪后,互联网的广泛应用为计算机视觉积累了大量图片数据,在2010年被深度学习引燃,达到机器识别图片准确率超过人类的水平,为人脸识别、自动驾驶等应用场景打下了坚实的基础。

语音技术,最早始于1952年AT&T贝尔实验室的一个能够识别10个英文数字的语音识别系统,79年代开始有大量研究人员投入研究语音技术,80年代由于电传业务的广泛应用。积累了大量的文本数据,更加方便语音模型的训练。进入21世纪,深度学习也为语音技术点了一把火,把语音识别技术提升到了可以进入人们生活的程度,如今智能语音助手、语音导航随处可见。

自然语言处理,这个方向的技术几乎是与机器翻译这个需求捆绑在一起发展的,当机器翻译带来热潮时,自然语言处理的研究如火如荼的发展,当机器翻译遭遇冷落时,自然语言处理的研究热情也被浇灭。直到90年代,互联网的出现才出现机器翻译之外的更多需求,比如:网页搜索、语音交互等。自然语言处理技术出现过两大流派:基于语法规则的符号派和基于统计的随机派。符号派认为,应该按照词法、句法和语法规则的方式来分析任何句子,比如:主语之后一定是谓语这种。而随机派则认为,每个词之间的关系,可以根据他们相互出现的概率来表达,因为在一起出现的越频繁,之后再次出现的可能性就越大,比如:“中国”和“人”的组合比“中国”和“水面”的组合出现的概率更大,所以“中国人”更是一个合适的词语。早在90年代以前,由于计算力和文本数据集达不到随机派的要求,符号派一度占据上风,但是随着计算力的提升和互联网带来的大量文本数据,再加上深度学习的助力,符号派已经逐渐的销声匿迹了。曾经在机器翻译应用上出现过一句玩笑:每当我开掉一个语言专家,我的机器翻译准确度就会提升一点。

规划决策系统,一度是以棋类游戏为载体的,60年代的跳棋程序通过穷举法战胜人类。而同样的方法却在象棋中寸步难行,因为如果这样做的话,每一步机器的思考时间将是以年为单位的。人们因此在算法中引入了剪枝的思想,剔除获胜可能性过低的走法,减少计算的复杂度。终于在1997年战胜人类冠军,确立了人类无法在象棋上战胜机器的局面。而相对于象棋,围棋的复杂度无法单纯用剪枝的方法达到人类高手的水平。Deep Mind开创性的将深度学习和强化学习结合,最终在2016年战胜人类冠军。自此,棋类游戏的使命告一段落,规划决策系统达到了可以步入人类生活的程度,机器人控制和无人车将是它下一个挑战的目标。

人工智能的今生

人工只能现在已经无处不在的渗透到我们生活的方方面面了,从手机语音助手到网上商城的商品推荐,再到智能安防系统,都会出现人工智能的身影,下面我们将从技术层和算法层来介绍人工智能的今生。

技术层,应用在我们生活中的人工智能系统主要依托于语音处理技术、自然语言处理技术和视觉处理技术三大技术领域。

语音处理,现在可以做到在相对安静和较近距离的环境下“听”的能力,比如:看电视时互换Siri,再打会现场演讲中对演讲者的内容转为文字,甚至翻译(翻译属于自然语言处理的领域,但输入部分人依托于语音处理)。还可以做到清晰、可懂,但是带一些口音的“说”的能力,比如微信读书中的听书功能,以及各类导航系统的语音导航。

自然语言处理,现在最有成效的领域当属机器翻译,Google的GNMT系统已经可以很准确的表达出原诗句中的意思,这一系统的突破在境外旅游,对外会议场景上的应用将大大减少沟通成本。其他应用自然语言处理技术的场景,还有对话问答系统,比如:Siri、智能音箱等,目前由于这方面的应用还存在大量未攻克的难题,因此还停留在比较原始的层面

视觉处理,现在已经可以非常成熟的完成图像识别、图像分类、图像标注(标注图像中哪个是猫,哪个是汽车)等工作。目前机器离具有“看”的能力,只差理解分析了,比如能完成一个看图说话的任务。而这一步的难度将远超识别、分类、标注难度的总和。

算法层,我们还是来看机器学习,目前机器学习得到广泛应用的场景都是一些垂直领域,比如:医学影像中识别肿瘤。这些领域有2个特点:

1. 问题本身比较狭窄,比如,分类、预估

2. 被分析问题的各项数据比较好积累

从这两个特点可以看出,目前得到广泛应用的大都是监督学习方向的问题。在下一阶段,算法层要致力于更好地解决非监督学习问题。2014年Ian Goodfellow提出的GANs被认为是解决非监督学习的一个重要拐点。GANs(生成对抗网络)是一种可以生成大量方针样本的模型,它的实现方式是通过一个生成器和一个识别器相互博弈,生成器不断生成仿真数据去欺骗识别器,识别器识别出哪些是真实数据,哪些是生成器生成的数据,如此往复就可以生成大量接近真实数据的样本。

人工智能的未来

人工智能大爆发的今天,市场对于人工智能产品的需求大大增加,这个方向带来的价值也随之升高,越来越多的企业和资金也将会源源不断的投入。在这种环境下,进一步推动基础设施层的发展,促使更多的研究者投入算法层和技术层当中,这可能会大大缩短攻克当前难题的时间。可以想象未来机器可以很自然的发音和你对话,准确的回答你的问题,告诉你每张图片中发生的故事。

当然上面这些都是过于长远的展望,下面我们来探讨下基于当前人工智能现状在接下来的几年中,人工智能要在何处发力,解决什么样的问题。

1. 训练机器的所需的数据量减少,即只需要少量的数据便可完成训练,比如,使用十几张猫的图片,就可以让机器认识猫(当前训练图片都是十万张以上)。

2. 压缩模型大小,当前模型的块头都比较大,很难装载到移动设备上,如果可以做好这一工作,像扫地机器人这种设备将会具有更高的只能,完成更复杂的任务。

3. 在当前感知能力的基础上,让机器具有更强大的理解和决策能力。

以上三点是未来几年我们要做的事情,也是很大概率可以做好的事情。

唐三的结论

1. 人工智能此次爆发,深度学习起到了绝大部分的作用,在当前热潮中如果要出现“爆款”人工智能产品,必然要用到深度学习。当然要合理、合适的将业务理解和深度学习有机结合的应用,而不是“霸王硬上弓”。

2. 高质量的数据积累是实现优秀人工智能的必要条件,所谓高质量数据,是指能够完全的覆盖业务的绝大多数特征和场景。当前数据的获取并不是太难的事情,挑战主要集中在数据的提纯(哪些要丢弃,哪些要保留)和存储上。

3. 人工智能产品的发展路线,基本上可以按照如下步骤进行:

a) 将现有问题通过监督学习方案进行解决,初步应用人工智能;

b) 通过上一阶段持续运营收集的数据和经验,逐步向非监督学习方向扩展,实现中级人工智能应用;

c) 引入强化学习,结合上一阶段成果,完成高级人工智能应用。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180324G1BRMI00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券