V
主页
[机器学习理论] 霍夫丁不等式(hoeffding's inequality)到 UCB
发布人
本期code:https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/hoeffding's_inequality.ipynb 另外一个重要的 bound:BV1QC4y1A7Gs(ELBO)
打开封面
下载高清视频
观看高清视频
视频下载器
谁在下面出来吧
[pytorch distributed] 02 DDP 基本概念(Ring AllReduce,node,world,rank,参数服务器)
[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[pytorch] Tensor shape 变化 view 与 reshape(contiguous 的理解)
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[pytorch] torch.nn.Bilinear 计算过程与 einsum(爱因斯坦求和约定)
[纳什荐书][生成式AI] 01 《GPT图解》导读
UCB《离散数学和概率论|CS70 Discrete Mathematics and Probability Theory 2015》中英字幕
[pytorch] 激活函数(梯度消失)sigmoid,clamp,relu(sparse representation,dying relu)
[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新(forward,loss.backward(), optimizer.step)
【计算机视觉】从图像距离(图像相似性)的计算(ahash/dhash/phash/whash)到以图搜索的实现(deep ranking)(一)
[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程
[不务正业] canvas ctx.getImageData rgba 图像灰度化(gray scale)
[LLMs 实践] 21 llama2 源码分析 GQA:Grouped Query Attention
[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
【搜索算法】【search】01 python-astar 图上搜索(graph search)f(n)=g(n)+h(n)
[LLMs 实践] 14 llama2 introduction 及 fine tune llama2(guanaco dataset)
【计算机视觉】基于 Siamese network 的图像相似性计算(keras 预训练网络及微调,多输入单输出)
[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif(以 CartPole 为例,mode='rgb_array')
[蒙特卡洛方法] 03 接受/拒绝采样(accept/reject samping)初步 cases 分析
[LLMs 实践] 11 gradient accumulation 显存优化 trick
[LLMs 实践] 12 LLM SFT training (trl SFTTrainer、alpaca dataset)
[LLMs 实践] 20 llama2 源码分析 cache KV(keys、values cache)加速推理
[pytorch distributed] nccl 集合通信(collective communication)
【爬虫】【豆瓣爬虫】01 豆瓣热门电影/电视,基于 api 爬虫
【计算机体系结构 cs152 2023】伯克利—中英字幕
[python 全栈] python 装饰器(decorator)及 functools.cache
[LLMs 实践] 04 PEFT/LoRA 源码分析
[LLMs 实践] 17 llama2 源码分析(RMSNorm 与 SwiGLU)
[prompt engineering] 从 CoT 到 ToT(Tree of Thoughts)
【python番外】python函数式编程与闭包与yield关键字
Andrej Karpathy Keynote & Winner Pitches at UCB AI Hackathon 24 Awards Ceremony
[pytorch 强化学习] 07 迷宫环境(maze environment)Q Learning(value iteration)求解(策略关闭 off)
[pytorch 强化学习] 05 迷宫环境(maze environment)策略梯度(Policy Gradient)求解
【数字图像处理】视频关键帧检测(I-frame,P-frame),ffprobe,视频推荐,video embedding
[概率 & 统计] kl div kl散度的计算及应用(pytorch)
【excel数据分析】幂律分布拟合城市GDP(幂律分布 vs. 指数分布 vs. 线性拟合 vs. 多项式拟合)
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)