什么是梯度爆炸:
What is gradient explosion?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: easy
分类: Deep Learning
标签: Exploding Gradient, NaN, Training Instability
参考答案摘要
答案 误差梯度是神经网络训练过程中计算的方向和数量,用于以正确的方向和合适的量更新网络权重。在深层网络或循环神经网络中,误差梯度可在更新中累积,变成非常大的梯度,然后导致网络权重的大幅更新,并因此使网络变得不稳定。在极端情况下,权重的值变得非常大,甚至于溢出导致NaN值。网络层之间的梯度(值大于1.0)重复相乘导致的指数级增长会产生梯度爆炸。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。