Colossal-AI开源复制ChatGPT训练 RLHF人类反馈强化训练过程
发布人