大模型分布式训练:Training LLMs at Scale - Deepak Narayanan _ Stanford MLSys #83
发布人