S-Lab提出用于视频指令跟随的高质量合成数据集LLaVA-Video-178K(今日Arxiv 10月4日)
发布人