V
主页
Talk|UW-Madison蔡沐:图像可编码为任意数量Token,俄罗斯套娃式多模态大模型
发布人
本片为将门-TechBeat技术社区第610期线上分享Talk! 有问题?想提问?快来在https://datayi.cn/w/xogkA8No的【交流区】留言!威斯康星大学麦迪逊分校博士生蔡沐会亲自下场回复哦! 更多Talk视频,尽在将门TechBeat技术社区>>www.techbeat.net
打开封面
下载高清视频
观看高清视频
视频下载器
Talk|CVPR'24 Oral:超越3D - Point Transformer V3中的多模态特征提取新构想
Talk|香港大学戚张扬:物体级别3D点云多模态大模型
Talk | 卡耐基梅隆大学林之秋:利用多模态大模型对图像/视频/3D生成进行自动优化与评估
Talk | ACL'23 杰出论文,MultiIntruct:通过多模态指令集微调提升VLM的零样本学习
Talk | ICLR'23 Oral 德州大学奥斯汀分校薛子慧:模态聚焦假说-理解跨模态知识蒸馏
Talk | 北京大学于博涵:EventPS:基于事件相机的实时光度立体视觉
Talk|加州大学洛杉矶分校鲁盼:基于大型语言模型的多模态数学推理
Talk | CoRL 2023 Oral 上海交通大学迮炎杰:通用机器人操作的视觉表征
Talk | 西安交通大学博士生赵子祥:基于先验知识指导的多模态图像融合算法研究
Talk | 华为谢恩泽: PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练
Talk|伊利诺伊大学香槟分校张凯风:AdaptiGraph - 材料自适应的图神经动力学模型
Talk | 香港中文大学(深圳)颜旭:利用跨模态知识蒸馏增强点云的表征学习
Talk | SIGGRAPH'23 Best Paper 秦颖思:分罗曼三维显示器—各点独立变焦显示技术
Talk | 马里兰大学贺帅:Transformer中的结构冗余性探索
Talk|CityU 助理教授马佳葳: CVPR 2024, 基于多模态理解的混合数据专家模型
Talk | 西湖大学鲍光胜:Fast-DetectGPT:高效零样本机器生成文本检测
Talk | MIT许逸伦:解锁由物理启发的深度生成模型-从扩散模型到泊松流模型
Talk | 香港中文大学陈玉康:长文本大语言模型高效微调方法
Talk |新加坡国立大学胡志元:Uncertainty of Thoughts:大型语言模型的信息搜寻与决策
Talk | UCSB博士生王丹青: 大语言模型的协作学习以及个性化生成评估
Talk|东京大学楚选耕:仅需单图,秒级重建可驱动3D头像
Talk | 新加坡国立大学博士侯皓文:RWKV论文解读 - 在Transformer时代重塑RNN
Talk|浙江大学&西湖大学曹淼:视频单曝光压缩成像重建算法探索
Talk | 香港中文大学张懿元:由MetaTransformer探索统一的多模态学习
Talk|卡内基梅隆大学李博文:适用于机器人的可泛化的目标感知
Talk|马萨诸塞大学阿默斯特分校张洪鑫:利用基座模型促进多具身智能体间的合作
Talk | 斯坦福大学徐霄萌:Dynamics-Guided Diffusion Model:用于机械手设计的动力学指导扩散模型
Talk | 清华大学在读博士生李一鸣:后门攻击简介
Talk|香港大学李卓凌:统一多场景的单目3D目标检测
Talk | 加州大学洛杉矶分校周诗杰:3DGS时代的三维场景表示与生成
Talk | ICCV'23北京通用人工智能研究院黄江勇:ARNOLD-三维场景中基于语言的机器人任务学习
Talk|香港大学陈汐:零样本图像编辑中ID一致性与生成多样性的平衡
Talk | 上海交通大学庞祥鹤:上交大提出⼤模型社会模拟器MATRIX,价值对齐胜过GPT4
Talk | 北京通用人工智能研究院黄思远:让通用智能体理解三维世界
Talk|香港科技大学苟耘豪:MoCLE - 指令聚类MoE+通用专家解决多模态大模型任务冲突
Talk|清华大学袁天远:PreSight - 利用NeRF先验帮助自动驾驶场景在线感知
Talk | 天津大学博士生赵煜:从平面图像中理解空间语义 - 视觉空间位置描述
直播回顾 | 大淘宝技术“搜索算法”专场①:淘宝搜索召回、个性化搜索排序
Talk | 智谱AI CTO张鹏:面向大规模知识图谱的预训练模型
Talk | 伊利诺伊大学安全学习实验室系列①: 可信机器学习: 机器学习鲁棒性, 隐私性, 泛化性, 及其内在关联