大模型自我改善对齐,无需人类反馈
发布人