V
主页
京东 11.11 红包
【EuroSys'22】GNNLab: A Factored System for Sample-based GNN Training over GPUs
发布人
【EuroSys'22】GNNLab: A Factored System for Sample-based GNN Training over GPUs 论文链接:https://dl.acm.org/doi/pdf/10.1145/3492321.3519557 论文内容:本工作深入分析了传统基于时间共享(time sharing)设计思想的图神经网络采样训练过程中存在的GPU内存竞争问题和数据冗余问题,提出了基于空间共享(space sharing)设计思想的新型GNN采样训练系统,通过将采样和训练任务在物理硬件层面解耦,使用不同GPU来分别执行采样和训练任务,避免了GPU内存竞争和数据冗余问题。此外,本工作提出了基于预采样的GPU缓存策略,不但能够获得接近理想情况的缓存命中率,同时能够适应于不同类型的图数据和采样算法,大大减少了从CPU和GPU间的特征数据传递。在多种数据集、采样算法和GNN模型上的实验表明,基于DGL训练引擎的实现能够将整体性能提升2~9倍,缓存命中率达到理想最优情况的90%-99%。
打开封面
下载高清视频
观看高清视频
视频下载器
【PPoPP'20】 XIndex: A Scalable Learned Index for Multicore Data Storage
【SIGMOD'22】Ad Hoc Transactions for Web Applications
【OSDI24】Fast and Scalable In-network Lock Management Using Lock Fission
王则可:Smart Network enhanced AI Systems
【FAST '22】 HTMFS: Strong Consistency Comes for Free with HTM in PMFSes
【EuroSys21】Bridging the Performance Gap for Copy-based GC atop NVM
肖文聪:Rubick:Exploiting Job Reconfigurability for Deep Learning Cluster Scheduling
【FAST '22】MT2: Memory Bandwidth Regulation on Hybrid NVM/DRAM Platforms
【OSDI'20】Fast RDMA-based Ordered Key-Value Store using Remote Learned Cache
计算机系统研究的一些体会-陈海波(ChinaSys分享)
【USENIX Security '22】 A Hardware-Software Co-design for Efficient Intra-Enclave
【ATC '23】Bridging the Gap between Relational OLTP and Graph-based OLAP
5.2 虚拟内存
3.3 微内核架构
【ATC'22】EPK: Scalable and Efficient Memory Protection Key
【NSDI'21】Unifying Timestamp with Transaction Ordering for MVCC with DST
USENIX ATC '20 - UnderBridge
5.3 物理内存分配
操作系统实验讲解:进程与线程
2.5 系统调用
【HPCA'23】Efficient Distributed Secure Memory with Migratable Merkle Tree
操作系统的演化-夏虞斌老师
5.1 内存管理的挑战
4.5_为什么要引入线程?线程有什么特点?
【OSDI'22】Microsecond-scale Preemption for Concurrent GPU-accelerated DNN Infe...
IPADS OSDI23论文介绍之Off-path SmartNIC性能分析
【OSDI'21】Retrofitting High Availability Mechanism to Tame Hybrid Transaction/...
【ASPLOS'23】BeeHive: Sub-second Elasticity for Web Services with Semi-FaaS Execut
3.4 外核Exokernel
(青年学者报告)李永坤老师:面向NewSQL数据库的键值存储系统
0.2 操作系统的未来展望
IPADS OSDI23论文介绍之HEDB
可扩展操作系统同步原语:原理与实现(陈海波老师的报告)
1.1 操作系统的定义
IPADS OSDI23论文介绍之DuVisor
GNN-26.Graph U-Nets(ICML 2019)
1.4 ChCore架构简介
操作系统实验讲解:内存管理
2.4 中断与异常的处理流程
【APNET'23】Microsecond-scale Datacenter Computing with RDMA: Characterization...