V
主页
[NSDI 2024] Parcae: 可抢占实例中主动、liveput优化的DNN训练
发布人
通过主动调整DNN训练作业的并行化策略,在实例抢占和分配真正发生之前适应预测的资源变化,从而在可抢占实例上实现廉价,快速和可扩展的DNN训练
打开封面
下载高清视频
观看高清视频
视频下载器
[NSDI 2024] DISTMM: 加速多模态模型训练
[NSDI 2024] GRACE: 通过神经编解码实现抗损的实时视频
[NSDI 2023] DNN训练中优化GPU能效
[NSDI2023] TopoOpt: 为DNN训练作业联合优化网络拓扑和并行化策略
[NSDI 2024 THC:tensor同态压缩加速分布式DL训练
[NSDI 2024] 分布式DL训练中的专有网络
[NSDI 2024] CASSINI: ML集群中的网络感知job调度
ASPLOS2024上LLM推理服务优化分享
[NSDI 2024] Gemino: 视频会议中鲁棒及可实操的神经压缩
[NSDI 2024] 通过embedding调度加速DL推荐训练
[NSDI 2023] ModelKeeper:根据模型相似性自动化预热,进而加速DNN训练
[NSDI 2023] Empowering Azure Storage with RDMA
字节万级GPU集群LLM训练
Optimal Control (CMU 16-745) 2024 Lecture 19:卡尔曼滤波
[I3D 2024] 论文Fast-Forward
[SIGGRAPH 2024] 实时物理毛发插值
SIGCOMM2024:阿里云HPN 7.0,用于大模型训练的数据中心网络
Gartner's Top 10 Tech Trends for 2024
基于主动推理的复杂任务在线Pareto最优决策案例
AMD Advancing AI PCs in 2024
针对AI工作负载优化的存储架构
走向一个ML优化加速的大一统理论
FAST2024最佳论文,十余年阿里云弹性块存储(EBS)演进
Big Ideas in 2024:AI优先游戏
ICAPS 2024 Tutorial, 寻找经典规划问题的多个规划
SIGIR 2024,信息检索发展历程
Big Ideas in 2024:语音优先Apps展望
Optimal Control (CMU 16-745) 2024 Lecture 22:自动驾驶和博弈论
[NSDI2023] Tambur: 通过流式编码对视频会议进行高效损失修复
[I3D 2024] Solvers and Simulation
适用于 GenAI 工作负载的以太网结构
AI Hardware
ICRA2024 LHMP研讨会:Isn't Motion Prediction just Model-based RL?
可微轨迹优化作为强化和模仿学习的策略表示
Iceberg Summit 2024主题演讲:The Quiet Revolution
运行在 Ray+Kubernetes的AI应用
KDD 2024,大模型驱动的元结构发现
[NSDI2023] SelfTune: 集群管理调优
Groq LPU
[NSDI2023] Boggart: 加速回顾型视频分析