导语:地平线机器人技术资深算法研究员罗恒老师,为大家分析Batch Normalization背后的动机和原理,以及后续的发展。 雷锋网按:作者罗恒,地平线机器人技术资深算法研究员。2011年博士毕业于上海交通大学,后随Yoshua Bengio从事博士后研究,2014年加入百度深度 ...
ICML2025年时间检验奖(Test of Time)颁给了Batch Normalization。在这篇发表于2015年的论文中,作者提出深度神经网络训练中的“内部协变量偏移”问题。直观理解,就是隐藏层的数据分布会随着训练的进行而变化,而前一层的变化又会影响下一层的学习。这种层与层 ...