V
主页
Talk|香港大学陈汐:零样本图像编辑中ID一致性与生成多样性的平衡
发布人
本片为将门-TechBeat技术社区第617期线上分享Talk! 有问题?想提问?快来在https://datayi.cn/w/YoXvpb6R的【交流区】留言!香港城市大学博士生陈汐会亲自下场回复哦! 更多Talk视频,尽在将门TechBeat技术社区>>www.techbeat.net
打开封面
下载高清视频
观看高清视频
视频下载器
Talk|UW-Madison蔡沐:图像可编码为任意数量Token,俄罗斯套娃式多模态大模型
Talk|香港大学李卓凌:统一多场景的单目3D目标检测
Talk|清华大学诸子钰:面向具身智能的通用3D视觉语言理解
Talk|伊利诺伊大学香槟分校张凯风:AdaptiGraph - 材料自适应的图神经动力学模型
Talk|浙江大学&西湖大学曹淼:视频单曝光压缩成像重建算法探索
Talk|波形智能CTO周王春澍:可自主进化的AI智能体系统
Talk | 北京大学于博涵:EventPS:基于事件相机的实时光度立体视觉
Talk | 西湖大学鲍光胜:Fast-DetectGPT:高效零样本机器生成文本检测
Talk |新加坡国立大学胡志元:Uncertainty of Thoughts:大型语言模型的信息搜寻与决策
Talk|Mila研究所&蒙特利尔大学刘圳:三维表征和三维网格的重建与生成
Talk|东京大学楚选耕:仅需单图,秒级重建可驱动3D头像
Talk|卡内基梅隆大学李博文:适用于机器人的可泛化的目标感知
Talk | 天津大学博士生赵煜:从平面图像中理解空间语义 - 视觉空间位置描述
直播回放 | 梦“想”何时成“真” - 图形渲染 vs 图像生成
Talk | 卡耐基梅隆大学林之秋:利用多模态大模型对图像/视频/3D生成进行自动优化与评估
Talk|CityU 助理教授马佳葳: CVPR 2024, 基于多模态理解的混合数据专家模型
Talk | 新加坡国立大学赵轩磊:Pyramid Attention Broadcast:通向视频模型的实时生成
Talk|马萨诸塞大学阿默斯特分校张洪鑫:利用基座模型促进多具身智能体间的合作
直播回放 | 科研的使命:学术界 vs 工业界
Talk|清华大学袁天远:PreSight - 利用NeRF先验帮助自动驾驶场景在线感知
Talk | 香港中文大学陈玉康:长文本大语言模型高效微调方法
Talk | ICCV'23北京通用人工智能研究院黄江勇:ARNOLD-三维场景中基于语言的机器人任务学习
Talk | 英伟达范麟熙:MineDojo:基于Minecraft的开放式通用人工智能体学习平台
Talk | 斯坦福博士生黄文龙:利用基础模型推动机器人在开放世界中的泛化
Talk | 加州大学洛杉矶分校周诗杰:3DGS时代的三维场景表示与生成
Talk | 清华大学在读博士生李一鸣:后门攻击简介
Talk|北京大学张嘉曌:NaVid - 视觉语言导航大模型
Talk | 杜克大学在读博士生李昂: 通信和计算效率联合优化的个性化联邦学习
Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练
Talk | 莫纳什大学在读博士琚烈:大规模眼底图像分类的挑战(MMAI系列Talk③)
Talk | 纽约州立宾汉姆顿大学博士生丁琰:开放环境中机器人的任务与动作规划
Talk | 清华大学交叉信息研究院黄浩栩:用基础大模型解锁通用具身智能
Talk | ICCV'23 清华赵天辰:Ada3D-基于动态推理的3D感知模型压缩及软硬件协同优化
Talk | CoRL 2023 Oral 上海交通大学迮炎杰:通用机器人操作的视觉表征
Talk | SIGGRAPH'23 Best Paper 秦颖思:分罗曼三维显示器—各点独立变焦显示技术
Talk预告|滑铁卢大学张舸: 高性能透明大语言模型-MAP-Neo
Talk | 南洋理工大学助理教授潘新钢:拖动你的GAN - 在生成图像流形上基于控制点的交互式图像编辑
Talk | 南洋理工大学博士生刘畅:引用分割简述-从经典任务到广义引用分割
Talk | 牛津大学博士后研究员边佳旺:SC-DepthV3-动态场景中的自监督单目深度估计
Talk | 麻省理工学院尹天为:DMD - 扩散模型蒸馏新范式