V
主页
讲座10 | 具身智能视角下的三维场景理解、生成与交互——北京通用人工智能研究院研究员贾宝雄
发布人
智猩猩具身智能前沿讲座第10讲的直播回放,讲者为北京通研院BIGAI通用视觉实验室研究员贾宝雄博士。 贾宝雄博士等研究人员提出一个百万级别的3D视觉语言数据集SceneVerse,并提出了Grounded Pre-training for Scenes (GPS)预训练框架。而由于现有三维场景生成算法并不考虑物理合理性,贾宝雄等研究人员又提出了一种面向具身智能的场景生成算法PhyScene。与PhyScene有关的论文收录于CVPR 2024并获得Highlight。 针对基于对场景理解能力的两个典型的下游任务,贾宝雄等研究人员又提出基于场景的人体动作生成算法AffordMotion和真实场景中的移动操作系统COME-Robot,与AffordMotion相关的论文获得了CVPR 2024Highlight。
打开封面
下载高清视频
观看高清视频
视频下载器
讲座 | 三维场景中的具身多模态感知与交互——上海人工智能实验室研究员王泰
讲座 | 交互式3D世界生成——斯坦福大学博士生俞洪兴
讲座 | 三维世界中的具身通用智能体LEO——北京通用人工智能研究院实习研究员黄江勇
讲座 | 可泛化的具身智能操作技能学习——上海科技大学助理教授、谷歌实习研究员顾家远
讲座 | 基于多模态思维链的端到端具身智能大模型EmbodiedGPT——香港大学在读博士穆尧
讲座 | 视觉推理与具身智能——上海交通大学长聘教轨助理教授、博导李永露
公开课 | 玻璃基板Chiplet先进封装及多物理场仿真——湖南越摩研究院院长马晓波
讲座 | 高泛化及样本高效的具身智能决策方法——清华大学智能产业研究院(AIR)在读博士李健雄
讲座 | 利用长视频生成模型释放端到端自动驾驶泛化性——理想汽车实习研究员马马恩慧
2025顶会热点!三小时带你吃透【具身智能】 ,第二讲——LLMS for robotics
AI奇点说 | 第九期:未来走进现实,机器人开始“上岗”你准备好了吗?
讲座 | 大模型在具身多智能体合作中的研究进展与展望——清华大学在读博士郭旭东
讲座 | HiDiffusion:高效、无需训练的更高分辨率图像生成框架——旷视研究院高级研究员张慎
讲座 | 大模型驱动下的具身智能体脑身同步——香港大学在读博士罗谦
公开课 | RISC-V编译器技术与LLVM框架——兆松科技联合创始人兼CTO伍华林
视觉SLAM进阶-从零开始手写VIO
讲座 | 构建通用可泛化的自动驾驶世界模型——香港科技大学在读博士高深远
讲座 | 面向多模态大模型的具身智能平台LEGENT——清华大学THUNLP lab在读博士胡锦毅
直观理解Vision Transformer(ViT)及Diffusion Models使用扩散模型进行图像合成,
公开课 | 应对算力焦虑的Chiplet芯片架构探索与多物理场仿真——芯和半导体技术市场总监黄晓波
讲座 | Mono-InternVL: 突破原生多模态大模型性能瓶颈——上海 AI Lab OpenGVLab 博士后研究员罗根
讲座 | 无限三维场景生成——慕尼黑工业大学3D AI Lab在读博士生孟权
公开课 | 智算集群网络互连技术创新应用与展望——云脉芯联产品总监孙伟
讲座 | 在具身智能模拟器中针对动态灾害进行具身决策——UMass Amherst在读博士周沁泓
强推!这可能是导师都不讲的自动驾驶最新版教程,不愧是北航硕士团队分享!3小时就带我跑通了自动驾驶感知融合实战!简直比刷剧还爽!
对存内计算的思考|北京超弦存储器研究院首席科学家戴瑾GACS 2024演讲
这可能是最完整的【计算机视觉-三维重建】算法教程了吧!真的通俗易懂!建议收藏!——(人工智能、深度学习、机器学习实战、机器学习算法、Pytorch)
讲座 | DiT架构在视频生成模型中的应用与扩展——莫纳什大学在读博士马鑫
公开课 | 智算中心融合算力调度——矩向科技CEO黄朝波
讲座 | 面向具身智能的第一视角多模态模型评价基准EgoThink——清华大学智能产业研究院在读博士程思婕
这才是科研人该学的【Opencv+Pytorch】教程!一口气学完目标检测、图像分割、语义分割、图像生成,算法原理+实验分析,太通俗易懂了!机器学习|深度学习
【YOLOv11】一小时速通版!知名博士逐一解读配置文件以及代码复现,环境安装+推理+自定义数据集搭建与训练,入门到精通!
【能写进简历的项目】3小时带你掌握基于深度学习的车道线检测算法,原理详解+项目实战,看完就能跑通!毕设/课设/深度学习/计算机视觉/OpenCV
Transformer真的不难啊!100集带你逐层分解Transformer模型——注意力机制、神经网络、位置编码、编码器、解码器等!算法原理+实战,通俗易懂!
【比啃书效果好多了!】不愧是B站最强【麻省理工公开课】深度学习课程,顶级大佬带你恶补人工智能AI专业知识!-AI/人工智能/计算机视觉/MIT/麻省理工深度学习
我在B站上大学!【完整版-麻省理工-微积分重点】全18讲!学数学不看的微积分课程,看完顺滑一整年。_人工智能数学基础/机器学习/微积分/麻省理工/高等数学
公开课 | 用于Chiplet先进封装的大规模互连集成与验证——比昂芯产品市场总监赵瑜斌
2025顶会热点!三小时带你吃透【具身智能】 ,第一讲——什么是具身智能?
这可能是B站最全面的【3D点云+三维重建】教程!原理解读+实战分析,迪哥带你一口气学完!计算机视觉
讲座 | 三维室内场景纹理图生成——慕尼黑工业大学视觉实验室24届博士陈振宇