深度学习作为人工智能领域非常重要的一类技术实现方式,已经是目前大多数以AI为核心研究能力的企业的必修课程了。
我听过很多没有读过研究生或博士课程的同学跟我诉苦,觉得深度学习非常难,感觉没有着手点。那这次我就再上一张思维导图,来给大家做个简单的梳理。
如果想要做一个全面的了解,而只想画花十几个小时的话,那就把深色的部分了解一遍就可以了,至少可以把深度学习可以做的事情在各个领域的实现思路做个原理性了解是没问题的。
深度学习本身基于的科学理论确实比较复杂,比较难。然而并不是没有捷径可以走的,作为一个工程技术人员,通常不需要非常严谨的求证、非常科学的推导,只要求做好落地应用,那么就可以绕开一些不必要的坑。
陷坑一、基础数学
基础数学部分是难,但在应用中涉及到的基础数学非常有限,无非就是导函数、梯度,还有统计学中的方差、统计熵这样的概念就已经可以覆盖大部分的深度学习任务了。
陷坑二、论文
论文也是老大难问题,主要是英文读不懂,还有就是里面所做的推导太复杂。这种问题也好解决,关键抓住整个模型的“输入”、“输出”、“网络结构”、“损失函数”四个重要因素。这几个要素一旦清楚了,那么整个模型的工作原理就很容易了。
陷坑三、落地
落地部分确实是需要一定的工程能力,需要知道在服务器上开发使用哪些常用的Shell命令,哪些常用的Python包环境。这个需要一点时间的积累,没有人是在一开始就全都掌握的,所谓熟能生巧。
把握好这几个点你就不会在学习的过程中感到害怕。
作为入门普及,有几个典型的项目是值得看一看的。
计算机视觉方面:
图像分类、人脸识别、目标识别,都是既典型,又容易理解,而且还有落地价值的项目,作为入门非常合适。
自然语言处理方面:
分词、文章分类、Word to Vector转换(Word2Vec)、命名实体识别(NER)也是非常基础的自然语言处理原则和技巧。了解这些内容之后,你就清楚机器人是如何做垃圾邮件分类的,也会对像顺丰快递那样的自动填单机器人的实现原理了如指掌。通常这个部分从了解概念到明确落地的过程也就是几小时就足够了。
音合成和自动语音识别方面:
这是诸如Siri这类语音处理机器人的基础功能,这部分的深度学习模型除了会遵从前面提到的“输入”、“输出”、“网络结构”、“损失函数”以外,还会涉及到一些传统语音方面用到的工程技术技巧,比如傅里叶变换/逆变换,梅尔倒谱等。不过这些工程技术通常也是被封装好的可供调用的软件包,所以实现起来也不用我们亲自动手。这样落地就容易得多。
深度强化学习方面:
强化学习是比较难的部分,也是传统人工智能所研究的范畴。现在强化学习和深度学习结合到了一起,焕发了新的活力——它也是AlphaGO所基于的技术。深度强化学习旨在训练机器人能够在复杂环境中自己学到一套高质量的行动策略,并最终达成一个我们设定的目标。这是人工智能领域中永恒的研究话题。
生成对抗网络方面:
这是出现最晚的一类深度学习前沿领域研究,它每次训练是两个模型,一个生成模型一个判别模型。在训练中希望两者在对抗中成长——生成模型的生成能力越来越强,判别模型的判别能力越来越强。这类应用目前虽说是非常有趣,不过在真正商用落地的场景中还非常鲜见,主要还是由于还是有太多不成熟的地方,不过大家可以关注它的发展。
当你花了10几个小时了解了这些应用的方向和难度后就可以结合自己的优势和兴趣选择一个方向去深耕了。通常从这个时候开始到最后可以成为一名合格的深度学习工程师需要6个月到12个月的时间,主要视个人的工程经验和学习能力而定,当然工程经验好的人会更占便宜一些。
本文分享自 智能工场AIWorkshop 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!