[NSDI 2024] Parcae: 可抢占实例中主动、liveput优化的DNN训练

发布人

通过主动调整DNN训练作业的并行化策略，在实例抢占和分配真正发生之前适应预测的资源变化，从而在可抢占实例上实现廉价，快速和可扩展的DNN训练

打开封面下载高清视频观看高清视频视频下载器

[NSDI 2024] DISTMM：加速多模态模型训练

[NSDI 2024] GRACE：通过神经编解码实现抗损的实时视频

[NSDI 2023] DNN训练中优化GPU能效

[NSDI2023] TopoOpt: 为DNN训练作业联合优化网络拓扑和并行化策略

[NSDI 2024 THC：tensor同态压缩加速分布式DL训练

[NSDI 2024] 分布式DL训练中的专有网络

[NSDI 2024] CASSINI： ML集群中的网络感知job调度

ASPLOS2024上LLM推理服务优化分享

[NSDI 2024] Gemino：视频会议中鲁棒及可实操的神经压缩

[NSDI 2024] 通过embedding调度加速DL推荐训练

[NSDI 2023] ModelKeeper：根据模型相似性自动化预热，进而加速DNN训练

[NSDI 2023] Empowering Azure Storage with RDMA

字节万级GPU集群LLM训练

Optimal Control (CMU 16-745) 2024 Lecture 19：卡尔曼滤波

[I3D 2024] 论文Fast-Forward

[SIGGRAPH 2024] 实时物理毛发插值

SIGCOMM2024：阿里云HPN 7.0，用于大模型训练的数据中心网络

Gartner's Top 10 Tech Trends for 2024

基于主动推理的复杂任务在线Pareto最优决策案例

AMD Advancing AI PCs in 2024

针对AI工作负载优化的存储架构

走向一个ML优化加速的大一统理论

FAST2024最佳论文，十余年阿里云弹性块存储(EBS)演进

Big Ideas in 2024：AI优先游戏

ICAPS 2024 Tutorial，寻找经典规划问题的多个规划

SIGIR 2024，信息检索发展历程

Big Ideas in 2024：语音优先Apps展望

Optimal Control (CMU 16-745) 2024 Lecture 22：自动驾驶和博弈论

[NSDI2023] Tambur: 通过流式编码对视频会议进行高效损失修复

[I3D 2024] Solvers and Simulation

适用于 GenAI 工作负载的以太网结构

AI Hardware

ICRA2024 LHMP研讨会：Isn't Motion Prediction just Model-based RL?

可微轨迹优化作为强化和模仿学习的策略表示

Iceberg Summit 2024主题演讲：The Quiet Revolution

运行在 Ray+Kubernetes的AI应用

KDD 2024，大模型驱动的元结构发现

[NSDI2023] SelfTune: 集群管理调优

Groq LPU

[NSDI2023] Boggart: 加速回顾型视频分析

[NSDI 2024] Parcae: 可抢占实例中主动、liveput优化的DNN训练

[NSDI 2024] DISTMM： 加速多模态模型训练

[NSDI 2024] GRACE： 通过神经编解码实现抗损的实时视频

[NSDI 2023] DNN训练中优化GPU能效

[NSDI2023] TopoOpt: 为DNN训练作业联合优化网络拓扑和并行化策略

[NSDI 2024 THC：tensor同态压缩加速分布式DL训练

[NSDI 2024] 分布式DL训练中的专有网络

[NSDI 2024] CASSINI： ML集群中的网络感知job调度

ASPLOS2024上LLM推理服务优化分享

[NSDI 2024] Gemino： 视频会议中鲁棒及可实操的神经压缩

[NSDI 2024] 通过embedding调度加速DL推荐训练

[NSDI 2023] ModelKeeper：根据模型相似性自动化预热，进而加速DNN训练

[NSDI 2023] Empowering Azure Storage with RDMA

字节万级GPU集群LLM训练

Optimal Control (CMU 16-745) 2024 Lecture 19：卡尔曼滤波

[I3D 2024] 论文Fast-Forward

[SIGGRAPH 2024] 实时物理毛发插值

SIGCOMM2024：阿里云HPN 7.0，用于大模型训练的数据中心网络

Gartner's Top 10 Tech Trends for 2024

基于主动推理的复杂任务在线Pareto最优决策案例

AMD Advancing AI PCs in 2024

针对AI工作负载优化的存储架构

走向一个ML优化加速的大一统理论

FAST2024最佳论文，十余年阿里云弹性块存储(EBS)演进

Big Ideas in 2024：AI优先游戏

ICAPS 2024 Tutorial， 寻找经典规划问题的多个规划

SIGIR 2024，信息检索发展历程

Big Ideas in 2024：语音优先Apps展望

Optimal Control (CMU 16-745) 2024 Lecture 22：自动驾驶和博弈论

[NSDI2023] Tambur: 通过流式编码对视频会议进行高效损失修复

[I3D 2024] Solvers and Simulation

适用于 GenAI 工作负载的以太网结构

AI Hardware

ICRA2024 LHMP研讨会：Isn't Motion Prediction just Model-based RL?

可微轨迹优化作为强化和模仿学习的策略表示

Iceberg Summit 2024主题演讲：The Quiet Revolution

运行在 Ray+Kubernetes的AI应用

KDD 2024，大模型驱动的元结构发现

[NSDI2023] SelfTune: 集群管理调优

Groq LPU

[NSDI2023] Boggart: 加速回顾型视频分析

[NSDI 2024] DISTMM：加速多模态模型训练

[NSDI 2024] GRACE：通过神经编解码实现抗损的实时视频

[NSDI 2024] Gemino：视频会议中鲁棒及可实操的神经压缩

ICAPS 2024 Tutorial，寻找经典规划问题的多个规划