【CVPR2024】超越文本:在视觉信号理解中冻结的大型语言模型
发布人