transformers集成了Liger Kernel:在llm训练的时间更少、显存使用的更少
发布人