V
主页
京东 11.11 红包
[A100 02] GPU 服务器压力测试,gpu burn,cpu burn,cuda samples
发布人
本期 code:https://github.com/chunhuizhang/deeplearning-envs/blob/main/A100/gpuburn_cpuburn_cuda_samples.ipynb A100 开箱:BV1Yt42187NM 双4090:BV1A54y1F7kN
打开封面
下载高清视频
观看高清视频
视频下载器
[装机指南] 02 双卡4090 gpu-burn,cpu-burn,cuda-samples 性能测试
[A100 01] A100 服务器开箱,超微平台,gpu、cpu、内存、硬盘等信息查看
【深度学习环境搭建】02 gpu 服务器端部署 jupyter notebook server
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[小白向-深度学习装机指南] 01 双4090 涡轮版开箱启动 vlog(gpu burn,cpu burn)
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)
[动手写神经网络] 手动实现 Transformer Encoder
[sbert 01] sentence-transformers pipeline
[pytorch 加速] CPU传输 & GPU计算的并行(pin_memory,non_blocking)
[einops 01] einsum 补充与 einops 初步(实现 ViT 的图像分块)
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
[全栈深度学习] 02 vscode remote(远程)gpus 服务器开发调试 debugger(以 nanoGPT 为例)
[显卡环境] CUDA_VISIBLE_DEVICES 控制显卡可见性
[LLM & AIGC] nvidia chat with rtx 初体验
[generative models] 概率建模视角下的现代生成模型(生成式 vs. 判别式,采样与密度估计)
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[矩阵分析] LoRA 矩阵分析基础之 SVD low rank approximation(低秩逼近)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
【python 运筹优化】scipy.optimize.minimize 使用
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
[pytorch] [求导练习] 03 计算图(computation graph)及链式法则(chain rule)反向传播过程
[动手写神经网络] 如何设计卷积核(conv kernel)实现降2采样,以及初探vggnet/resnet 卷积设计思路(不断降空间尺度,升channel)
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[python 多进程、多线程、协程] 02 用 python 多线程实现生产者消费者流程
[pytorch] [求导练习] 02 softmax 函数自动求导练习(autograd,Jacobian matrix)
[LLMs 实践] 17 llama2 源码分析(RMSNorm 与 SwiGLU)
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[LLM+RL] 合成数据与model collapse,nature 正刊封面
【数字图像处理】HoG+SVM+NMS行人检测(pedestrian detection)(python-opencv)
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[全栈算法] docker nvidia pytorch gpu 环境及容器操作,端口号映射
[动手写 bert 系列] 02 tokenizer encode_plus, token_type_ids(mlm,nsp)
[mcts] 02 mcts from scartch(UCTNode,uct_search, pUCT,树的可视化)
[动手写神经网络] 02 逐行写代码 CNN pipeline 图像分类(模型结构、训练、评估)
[pytorch 模型拓扑结构] 深入理解 nn.CrossEntropyLoss 计算过程(nn.NLLLoss(nn.LogSoftmax))