文章导读:
1. 本节内容
2. 手写字体识别
3. 感知机
4. Sigmoid神经元
5. 神经网络的结构
6. 一个用于手写数字识别的简单神经网络
7. 梯度下降学习算法
8. 数字识别神经网络的实现
9. 关于深度学习
一. 本节内容
传统的计算机算法在解决问题的时候,通常都是由程序员制定好规则将问题进行分解,一步步进行解决。应用神经网络我们一般并不需要告诉计算机应该怎么去解决问题,而是只要给到足够的观测数据就可以了,它将会自动从这些数据中提取出解决方法。
通过“手写数字识别“这个常见但是普通编程方法很难解决的问题介绍了神经网络的基本知识。
本章我们将编写一段计算机程序来实现一个能识别手写数字的神经网络。没有使用其他特别的神经网络库,但是这段程序能够具有96%的数字识别精度,而且没有人工干预。此外。实际上,最好的商业神经网络已经很好的应用在银行支票处理以及邮局识别地址等。
我们专注在手写体识别是因为它是一个很好的学习神经网络的原型问题。做为一个原型,它刚好合适:识别手写数字是一个挑战,不是那么容易,而它也不需要一个极其复杂的方案或者巨大的计算能力。此外,它也是开发更多高级技术的好方法,比如深度学习。因此整本书我们将不断重复回到手写识别这个问题。这本书的后面,我们将讨论这些算法思想如何应用到计算机视觉的其他问题,还包括语言识别、自然语言处理和其他领域。
当然,如果本章只是写一个识别手写数字的计算机程序,那么将非常短小!在编写过程中,我们将介绍很多神经网络的关键思想,包括人工神经网络的两大类别(感知器和sigmoid神经元)以及神经网络标准学习算法,即随机梯度下降。整个过程我们将关注在阐述为什么这样处理是有效的,从而让你构建起神经网络直觉。这比只陈述基础的机制更加冗长,但这对更深入理解所学到的内容是值得的。在这些收获上,本章结束你将明白深度学习是什么,且它为什么这么重要。
................若上图文字看不清楚请点击放大之后看........
领取专属 10元无门槛券
私享最新 技术干货