gradient descent
整体代价函数 overall cost function
方差 squared-error
均方差 average sum-of-squares error
规则化项...具体而言,对于单个样例(x, y),其代价损失函数为:
?
这是一个方差损失函数。给定一个含有m个样例的数据集,我们可以是使用如下的整体代价损失函数表示:
?...在此重申一下这两个复杂函数的含义:J(W, b, x, y) 是针对单个样例计算得到的方差代价函数;J(W, b) 是整体样本代价函数,它包含权重衰减项。...我们现在来讲一下反向传播算法,它是计算偏导数的一种有效方法
3
反向传播算法
首先来讲一下如何使用反向传播算法来计算下式:
?...这两项是单个样例(x, y)的损失函数J(W, b, x, y)的偏导数。一旦我们求出该偏导数,就可以推导出整体代价函数J(W, b) 的偏导数:
?