V
主页
LLMs视角看差分隐私
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
字节万级GPU集群LLM训练
LLMs中的语言理解
Llama, Scaling Up LLMs in an Open Ecosystem
[Stanford MLSys] Serving 100s of LLMs on 1 GPU with LoRAX
AMSP:通过模型状态分区进行LLM扩展训练
LLMs:教编程的新方式
Serving Large Language Models with KubeRay on TPUs
通过语言、逻辑和YouTube视频数据实现长期操作的可扩展机器人学习
如何选择合适的开源LLMs
State of AI 2023
通过学习规划和感知进行任务和运动规划
Aligning LLMs with Direct Preference Optimization
[a16z] AI Food Fights in the Enterprise with Databricks Ali Ghodsi
医疗保健领域的LLMs如何推进行业前行
以人为中心的机器人以及学习如何实现通用性
[ISSCC2023] Lisa Su: 下一十年的计算效率创新
AI时代内存技术
LLMS 在财务部门的应用
Beyond LLMs: 智能体、涌现能力、中间引导推理、BabyLM
Computing and Planning with LLMs
Stanford CS25: Robotics and Imitation Learning
HPC视角下的混合精度
物理视角看GNN
GRASP on Robotics:波斯顿动力AI
金融市场中生成式AI和多模态agents应用
ibm应用开源方法训练LLM
MuxServe:灵活的多路复用实现高效的多个LLM服务
云端LLM生命周期管理
[ASPLOS2023] Heron:为深度学习加速器自动生成高性能约束库的方法
GPU.x:GPU共享
[SIGCOMM2023] : Offloading
Stanford CS25 V4:大语言模型到多模态大模型
边缘云端高效的LLM推理
KAN神经网络
ICRA2024 LHMP研讨会:Isn't Motion Prediction just Model-based RL?
[APNEET2023] 超大规模RDMA:经验和未来方向
Meta:大规模AI集群维护
[NSDI2023] Boggart: 加速回顾型视频分析
FAST2024最佳论文,十余年阿里云弹性块存储(EBS)演进
[NSDI 2024] CASSINI: ML集群中的网络感知job调度