V
主页
K8S在边缘端用于AI模型部署的演示
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
AI与3D生成
听我一句劝!不要再开热点啦!
[MLSys2024] AWQ:用于LLM压缩和加速的激活感知权重量化
基于意图和故障的轨迹预测,用于协同定位和防碰撞
多智能体系统中的真实世界强化学习:大规模自主合作性部署
SCENI:用于数据生成和AI自治安全的开源概率编程系统
SIGCOMM2024,CacheGen 用于快速模型服务的KV缓存压缩和流式处理
AI Hardware
AI与财务、分析及风险管理II
目标驱动AI: Towards AI systems that can learn, remember, reason, and plan
K8S中AI用例处理单元全景图
用于近存计算的DPU加速Peta Scale存储系统
NFS v4.2,用于AI架构中高性能和分布式数据处理的linux新标准
RSS2024:用于基于语言机器人导航的层级开放词汇 3D 场景图
针对AI工作负载优化的存储架构
高效ML模型中的合成技术
DBRX及MosaicAI部署个人LLM
行业视角看AI 机器人的发展
利用结构实现高效灵活的机器人接触操作
Jim Fan 谈 Nvidia 的 Embodied AI Lab 以及老黄关于所有机器人都将实现自主预测
J.P Fricker解构Blackwell GPU延迟
fVDB:具有空间智能的生成式物理 AI 的深度学习框架
AI应用于经济学
Naval对于AI创业的思考
机械工程前沿建设
阿里大规模计算集群网络稳定性的挑战与实践
Computer Architecture 2024,Memory Controllers:服务质量和性能 11
Mutimodal AI in Production
LeftoverLocals漏洞利用GPU本地内存泄露,影响大模型数据安全
Big Ideas in 2024:AI优先游戏
从物理系统中学习的欧几里得神经网络E(3)NN
[NSDI2023] Gemel: 边缘端基于模型合并方法的内存高效,实时视频分析
[APNEET2023] 超大规模RDMA:经验和未来方向
当前构建AI初创的真实情况
微软 CEO阐述ChatGPT、伦理AI
Noam Brown,通过self-play学习合作和竞争
自旋电子器件用于能效计算
11月新游推荐,3D版异星工厂,多人联机打造自动化世界,《星核工厂》
Ray Summit 2024,Apple弹性GPU资源管理
Stanford EE259: 相机的工作原理与架构及成像