我正在尝试用Java实现一个神经网络。我在学习神经网络时,在我的机器学习课本中遇到了这个问题:The output of the sigmoid function may be interpreted as the posterior
probability that为什么sigmoid函数的输出被解释为输入属于某一类的概率?
我开始实现神经网络的后端,但被python代码卡住了。下面是神经网络的代码。当我在一个要创建的应用程序中使用用户定义的类时,我得到了一个名为attributeError的错误。请帮我解决这个问题。return "NeuralNetwork: {}".format("-".join(str(l) for l in self.layers )) def sigmoid(self,x):
#compute and return sigmoid activa
我试图将我的神经网络的激活函数从sigmoid改为RELU (或者更具体地说是SELU)。因为我得到了很多爆炸性的渐变,所以我尝试使用批量归一化。我计算了误差函数的梯度w.r.t学习参数\beta和\gamma,但它们似乎与我在几个示例(遗憾的是只有Python)中看到的有点不同。我的导数如下所示: Derivation of error function w.r.t \beta 在这个推导过程中,我做错了什么? 非常感谢你的帮助。