这是[改善深度神经网络]课程第三周的习题,一共10道。
解答:
这个在课程的开始就讲到了,应该随机选取超参数的值。
答案是False
解答:
超参数的重要程度并不相同,比如学习率通常具有较高的重要程度。
所以答案是False
解答:
同时训练多个模型需要更高的算力,否则还是调优一个模型。
答案选项3
解答:
beta的选择最好是非线性,可以排除1和2,选项3如果r=0, beta=-9,如果r=0, beta=0,错误取值。
所以选选项2
解答:
超参数很难一次就选择对,通常是在不断迭代中找到最优。
答案False
解答:
虽然学术上对a[l]还是z[l]正规化还存在争论,但在本课程中推荐z[l]。
答案是选项2
解答:
加入一个很小的epsilon是为了避免除以0。
答案选项1
解答:
beta和r和权重一样,可以通过递归学习而来,而且不同层的beta和r并不同,也不存在一个固定的优化值。
答案为选项2、3
解答:
在测试阶段,没有足够的数据进行批量正规化,应该选取一个预估值,这个预估值通常根据训练阶段的值进行计算。
答案选项4
解答:
采用深度学习框架,可以减少编码量,但并不一定需要云主机来运行。
答案为选项1、2。
领取专属 10元无门槛券
私享最新 技术干货