原来收敛不了估计是之前的loss函数设置不对,导致学习率相对来说太大了

训练100个epoch的loss

1733140892597