V
主页
讲座 | 构建通用可泛化的自动驾驶世界模型——香港科技大学在读博士高深远
发布人
智猩猩自动驾驶新青年讲座第40讲的直播回放,讲者为香港科技大学在读博士、上海AI Lab OpenDriveLab实习研究员高深远。 上海人工智能实验室OpenDriveLab联合香港科技大学等研究人员构建了迄今为止最大的公共驾驶数据集OpenDV-2K,并且基于OpenDV-2K构建了自动驾驶领域中第一个大规模视频预测模型GenAD。相关论文收录于 CVPR 2024 Highlight。 此外,高深远博士等研究人员还提出了一种高质量可控的通用自动驾驶世界模型Vista。相关论文收录于NeurIPS 2024。Vista能够在高时空分辨率下预测逼真的未来,通过捕捉动态和保持结构的两种新损失函数,其预测保真度得到了极大提升。
打开封面
下载高清视频
观看高清视频
视频下载器
讲座 | 利用长视频生成模型释放端到端自动驾驶泛化性——理想汽车实习研究员马马恩慧
讲座 | 首解CARLA V2:基于隐世界模型的自驾强化模型Think2Drive——上海交通大学在读博士李奇峰
公开课 | 玻璃基板Chiplet先进封装及多物理场仿真——湖南越摩研究院院长马晓波
讲座 | 基于多模态思维链的端到端具身智能大模型EmbodiedGPT——香港大学在读博士穆尧
讲座 | 高泛化及样本高效的具身智能决策方法——清华大学智能产业研究院(AIR)在读博士李健雄
讲座 | 大模型在具身多智能体合作中的研究进展与展望——清华大学在读博士郭旭东
讲座 | 单视图引导的3DGS物体重建——加拿大西蒙菲莎大学GrUVi Lab在读博士母宇轩
讲座 | 无限三维场景生成——慕尼黑工业大学3D AI Lab在读博士生孟权
讲座 | 利用技能学习的扩散策略实现层次化机器人轨迹生成——香港大学在读博士生梁志烜
12篇NeurIPS'24|机器学习与数据科学:Lambda、协作世界模型、多域多模态时间序列数据集等
讲座 | 可泛化的具身智能操作技能学习——上海科技大学助理教授、谷歌实习研究员顾家远
讲座 | 超高分辨率图像生成——香港科技大学(广州)在读博士任菁菁
讲座 | 具身智能视角下的三维场景理解、生成与交互——北京通用人工智能研究院研究员贾宝雄
香港科技大学!CVPR&NeurIPS2024开源 | 迈向通用可泛化的自动驾驶世界模型(上篇)
讲座 | 使用大语言模型构建合作型具身智能体——马萨诸塞大学阿默斯特分校在读博士张洪鑫
讲座 | 结构化3DGS为高质量3D生成带来新思路——中国科学技术大学与微软亚洲研究院联合培养博士张博文
讲座 | 面向具身智能的第一视角多模态模型评价基准EgoThink——清华大学智能产业研究院在读博士程思婕
讲座 | DiT架构在视频生成模型中的应用与扩展——莫纳什大学在读博士马鑫
讲座 | 三维世界中的具身通用智能体LEO——北京通用人工智能研究院实习研究员黄江勇
讲座 | 自动驾驶中将轨迹和高精地图统一的环境表达方式——香港城市大学助理教授张祎凡
讲座 | 在具身智能模拟器中针对动态灾害进行具身决策——UMass Amherst在读博士周沁泓
长见识!菜鸟无人仓发货全过程
讲座 | 交互式3D世界生成——斯坦福大学博士生俞洪兴
讲座 | 文生图扩散模型中的精确颜色生成——巴塞罗那自治大学LAMP组博士后王凯
讲座 | 面向多模态大模型的具身智能平台LEGENT——清华大学THUNLP lab在读博士胡锦毅
讲座 | 基于扩散模型编码器模块的推理加速——南开大学在读博士李森茂
讲座 | 基于扩散模型和三平面外插法的无限大3D场景生成——东京大学在读博士吴桢楠
公开课 | 浅议RISC-V的误区、创新、商业模式和价值存续——芯来科技创始人胡振波
讲座 | 图像生成模型的知识注入在虚拟试衣AnyFit中的应用——上海交通大学在读博士李昱翰
3分钟带你了解三维重建
讲座 | 利用直线概率流加速Stable Diffusion的训练推理——德州大学奥斯汀分校24届博士刘星超
公开课 | 智算集群技术概览——腾讯专有云首席架构师方天戟
互联定义计算,AI 网络两大核心技术:RDMA和Chiplet|奇异摩尔联合创始人祝俊东GACS 2024演讲
震撼!京东亚洲一号无人仓
讲座 | V-IRL:根植于真实世界的AI Agents——香港大学CVMI Lab在读博士杨霁晗
元宇宙:下一代互联网
解决自动驾驶长尾问题,DOME模型结合扩散和OCC技术打造超真实世界模型
公开课 | 智算中心融合算力调度——矩向科技CEO黄朝波
讲座 | 利用多级框架和多解码器架构提高扩散模型训练效率——密歇根大学安娜堡分校在读博士张挥杰
讲座 | 多人互动中的人体动作与反应生成——上海交通大学在读博士徐良