SLAB(ICML2024):可应用在transformer中的归一化方法和注意力模块,附演示教程
发布人