用视觉语言模型自动生成奖励函数,训练多目标强化学习智能体
发布人