CLIP:从自然语言监督中学习可转移的视觉模型
发布人