从零开始手搓一个LLM(一)把参数缩减到足够单卡训练的NanoGPT
发布人