V
主页
ECCV'24 威斯康星大学麦迪逊分校 英伟达 | Dolphins:多模态学习提升自动驾驶像人类一样理解响应各种场景
发布人
+“SLYYDS24”,领【24年100篇最新智驾论文➕多领域面试真题➕公开课课件回放➕高质量交流群】,备<100> 在这篇论文中,来自以上单位的研究团队介绍了一种名为Dolphins的新型视觉语言模型,其设计目的是作为一个具有人类能力的对话式驾驶助手。Dolphins能够处理包括视频(或图像)数据、文本指令和历史控制信号在内的多模态输入,并生成与所提供指令相应的输出。。。。。。 标题:Dolphins: Multimodal Language Model for Driving 链接:https://vlm-driver.github.io/
打开封面
下载高清视频
观看高清视频
视频下载器
ECCV'24 NVIDIA | DiPIR:堪称"变色龙",可将3D物体无缝融合进各种场景,提升视觉真实感
ECCV'24 | "突破传统",通过直接BEV特征注意力加速在线建图和行为预测
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
融合人与环境的激光雷达三维动态场景感知 | 王程
CVPR2024 | 利用任务分解改进BEV分割任务!
ETH最新!CVPR | 2024NeLF-Pro:用于多尺度新视图合成的神经光场探针,一个方法解决多种规模场景的快速渲染重建
【B站强推】一小时彻底掌握提示工程(Prompt Engineering)超详细,草履虫都能听懂!!!(大模型|LLM|多模态|人工智能)
ECCV'24 开源 | 6DGS 又快又好,无需迭代的 单图像6D物体位姿估计
【免费】自动驾驶仿真实践:Apollo&CARLA联合仿真: L1 Apollo架构
自动驾驶规划控制概况
今晚直播预告:ICCV 2023 | SurroundOcc:环视三维占据栅格新SOTA! 韦祎,清华大学博士
重磅出炉!高翔《自动驾驶与机器人中的SLAM技术》新书配套课程发布
3.96万条众包和41.7万条自动化 的物理概念标注,助力VLMs突破 让机器人像人类一样理解物理世界
《智能网联汽车》暑期实训研学营精彩回顾
NeRF系列公开课02 | 基于NeRF的三维场景重建和理解
从0到1带你搭建一个自己的Agent!摸鱼神器,效率拉满!零基础搭建自动化AI图文Bot,手把手教学,通俗易懂的agent应用教程,小白必看!
ICRA | 2024:牛津大学针对NeRF和激光雷达的缺点,提出了NeRF融合激光雷达SLAM的大场景重建系统
CVPR2024 | RCBEVDet:毫米波雷达-相机在BEV空间下的融合方案
全面评估BEV感知算法: RoboBEV基准测试与 鲁棒性增强策略探索,
【自动驾驶技术】花18000大价钱买的无人驾驶课程,从入门到提升的自动驾驶算法——感知实战、视觉定位、预测系统、路径规划、控制理论、强化学习
中国科大新作 | 基于3D高斯的多模态融合在无界场景中的定位和重建
浙大、上海人工智能实验室等即将开源PGSR: 平面3DGS提升表面几何,超越 2DGS、GOF,实现渲染新高度
【Agent2024最新】Agent零基础入门到实战精通,手把手教你搭建企业级Agent智能体,底层原理技术讲解+项目案例解析+附上源码
AR光波导的应用与发展 | 郑昱
Yann LeCun点赞转发,StableIdentity: 只需一张图片即可把任意 人像插入到任意场景中
ECCV 2024 代码开源 | HTCL:分层时间上下文,超过LiDAR,问鼎OCC,霸榜所有视觉方案
提升四足机器人各种地形运动适应性的方法DTC(深度跟踪控制)
CVPR2024 | ADA-Track: 具有交替检测和关联功能的端 到端多摄像头3D多目标跟踪框架
清华叉院、理想提出DriveVLM,视觉大语言模型与自动驾驶融合,以提升自动驾驶能力
ECCV '24 CVPPA | KAN你能看见吗? KAN网络与 Sentinel卫星结合实现 高效且可解释的作物田地分割
10大与人工智能相关的<顶级会议>,哪些是你的投递首选?这些顶会论文与SCI论文相比如何呢?
【2024最新】54个大模型实战项目,练完即可就业,从入门到进阶,基础到框架,你想要的全都有,建议码住!超级适合小白入门学习,大模型教程
一窥大神们与中国智驾的这些年,入局智能驾驶汽车领域的12大企业的技术灵魂人物#端到端#人工智能#自动驾驶#智能驾驶#BEV感知#车载
L4自动驾驶技术首次赋能家用车,全球唯二、中国唯一的纯视觉高阶智驾系统!
全球最受关注的九款人形机器人,看完后细思极恐,难免生理不适
CVPR2024 | 一统所有目标感知任务,华科&字节提出感知模型GLEE,一次性解决图像和视频中的几乎所有目标感知任务
基于深度学习的三维重建与位姿估计系统设计 | 孙佳明
深度学习最热方向!今年最全的多模态大模型综述来啦!-神经网络/大模型/LLM
超越BEVFusion!GraphBEV:解决多模态特征不对齐和噪声问题,助力量产
看完特斯拉AI团队公布的最新自动驾驶发展蓝图,真的太震撼了!必须跟大家分享一下