你要训练模型一定要看斯坦福大学的100页HuggingFace《通过人类反馈的强化学习(RLHF)》教程讲解!
发布人