对于习惯使用 PyTorch 或 TensorFlow 的用户来说,调用 nn.LSTM 虽然高效,但也屏蔽了最核心的数学推导,结果代码写了好几年,loss 是怎么传回去的,脑子里还是一团浆糊。
这项由加州大学河畔分校地球与行星科学系领导,联合多家印尼顶尖科研机构完成的研究发表于2025年1月的arXiv预印本服务器(论文编号:2601.12029v1),有兴趣深入了解的读者可以通过该编号查询完整论文。