V
主页
京东 11.11 红包
【论文导读】视觉语言地学大模型综述(二)模型能力和下游任务
发布人
Liu, C., Zhao, R., Chen, J., Qi, Z., Zou, Z., & Shi, Z. (2023). A Decoupling Paradigm With Prompt Learning for Remote Sensing Image Change Captioning. IEEE Transactions on Geoscience and Remote Sensing, 61, 1–18. IEEE Transactions on Geoscience and Remote Sensing. https://doi.org/10.1109/TGRS.2023.3321752 Roberts, J., Han, K., & Albanie, S. (2023). SATIN: A Multi-Task Metadataset for Classifying Satellite Imagery using Vision-Language Models (No. arXiv:2304.11619). arXiv. https://doi.org/10.48550/arXiv.2304.11619 Roberts, J., Lüddecke, T., Das, S., Han, K., & Albanie, S. (2023, November 8). GPT4GEO: How a Language Model Sees the World’s Geography. NeurIPS 2023 Foundation Models for Decision Making Workshop. https://openreview.net/forum?id=egKxRC5gf8 Roberts, J., Lüddecke, T., Sheikh, R., Han, K., & Albanie, S. (2024). Charting New Territories: Exploring the Geographic and Geospatial Capabilities of Multimodal LLMs. 554–563. https://openaccess.thecvf.com/content/CVPR2024W/EarthVision/html/Roberts_Charting_New_Territories_Exploring_the_Geographic_and_Geospatial_Capabilities_of_CVPRW_2024_paper.html Shen, H., Li, H., Qian, Y., Zhang, L., & Yuan, Q. (2014). An effective thin cloud removal procedure for visible remote sensing images. ISPRS Journal of Photogrammetry and Remote Sensing, 96, 224–235. https://doi.org/10.1016/j.isprsjprs.2014.06.011 Yuan, Z., Mou, L., Xiong, Z., & Zhu, X. X. (2022). Change Detection Meets Visual Question Answering. IEEE Transactions on Geoscience and Remote Sensing, 60, 1–13. IEEE Transactions on Geoscience and Remote Sensing. https://doi.org/10.1109/TGRS.2022.3203314 Zhang, C., & Wang, S. (2024). Good at captioning, bad at counting: Benchmarking GPT-4V on Earth observation data (No. arXiv:2401.17600). arXiv. https://doi.org/10.48550/arXiv.2401.17600
打开封面
下载高清视频
观看高清视频
视频下载器
【论文导读】Qwen2-VL
毕设有救了!如何从零到一搭建自己的RAG系统!LightRAG、LLM、大模型RAG检索增强生成
【论文导读】多模态大语言模型综述(五)多模态幻觉
【论文导读】视觉语言地学大模型综述(一)导论
只需半天就能搞定的【时间序列预测任务】项目实战,华理博士精讲LSTM、Informer、ARIMA模型、Pandas、股票预测,学不会UP主下跪!附课件+源码
【论文导读】BLIP系列(四):BLIP-3
毕业论文终于有救了!这绝对是B站最全的【多模态+大模型+知识图谱】教程,轻松搞定大小论文创新点!!人工智能/深度学习/机器学习
被导师夸了3年的文献阅读+笔记整理方法!研0不会看论文的真心建议你来学三分钟!研究生/毕业论文/文献综述
【论文导读】多模态大语言模型综述(三)训练技术和数据源
最新多模态大模型QWEN2-VL详细教程-环境配置、数据集构建、模型微调、训练流程、效果展示
【论文导读】Stable Diffusion(一):介绍
【论文导读】大语言模型综述(二):大语言模型技术背景
【论文导读】CogVLM系列(一):CogVLM
【多模态论文解读】qwenvl & qwen2-vl
【论文导读】多模态大语言模型综述(一)介绍
【CSIG云讲堂】周嘉欢-大模型视觉提示学习方法
【论文导读】Qwen-VL
【论文导读】多模态大语言模型综述(二)模型架构
【论文导读】RemoteCLIP: A vision language foundation model for remote sensing
【论文导读】DiffusionSat:A generative foundation model for satellite imagery
【论文导读】大语言模型综述(一):介绍
【论文导读】BLIP系列(二):BLIP-2
【白皮书解读】1.1 空间数据智能大模型的定义及其发展历程
【论文导读】BLIP系列(一):BLIP
【机器学习算法】200集全,线性回归、逻辑回归、KNN、决策树、K-means、SVM、集成学习、EM算法、高斯模型十大机器学习算法一口气学完,原理+代码讲解
【论文导读】RSGPT: A remote sensing vision language model and benchmark
【论文导读】大语言模型综述(五):预训练和微调技术
【论文导读】OpenAI图像工作系列(一):iGPT
【论文导读】OpenAI图像工作系列(二):DALL-E
从0配置环境到跑通代码:pycharm+anaconda+pytorch+cuda全详解,最通俗易懂的深度学习环境配置教程!
【论文导读】CogVLM系列(二):CogVLM Family
【论文导读】大语言模型综述(四):主流大语言模型介绍
基于深度学习的多模态图像融合研究热点及顶刊思路经验分享
一口气学完回归算法、聚类算法、决策树、随机森林、神经网络、贝叶斯算法、支持向量机、神经网络等十二大机器学习算法!通俗易懂
【论文导读】多模态大语言模型综述(四)评估
【CSIG云讲堂】孙显-多模态遥感解译基础模型关键技术及应用实践
2024遥感科学研究生沙龙 直播录制
【双语】Variational Autoencoders
辛顿现场授课:AI在生物学上的神奇应用,太超前
直观理解大模型预训练和微调!四大LLM微调方法,RLHF基于人类反馈的强化学习微调