为啥我的训练集和测试集准确率能差这么多?!【transformer过拟合】到底要怎么解决啊!
发布人