[机器学习理论] 霍夫丁不等式（hoeffding's inequality）到 UCB

发布人

本期code：https://github.com/chunhuizhang/deeplearning_math/blob/main/tutorials/prob_stats/hoeffding&#39;s_inequality.ipynb
另外一个重要的 bound：BV1QC4y1A7Gs（ELBO）

打开封面下载高清视频观看高清视频视频下载器

谁在下面出来吧

[pytorch distributed] 02 DDP 基本概念（Ring AllReduce，node，world，rank，参数服务器）

[LLMs 实践] 18 llama2 源码分析 RoPE 相对位置编码的复数形式

[蒙特卡洛方法] 04 重要性采样补充，数学性质及 On-policy vs. Off-policy

[pytorch] Tensor shape 变化 view 与 reshape（contiguous 的理解）

[LLMs 实践] 03 LoRA fine-tune 大语言模型（peft、bloom 7b）

[pytorch] torch.nn.Bilinear 计算过程与 einsum（爱因斯坦求和约定）

[纳什荐书][生成式AI] 01 《GPT图解》导读

UCB《离散数学和概率论|CS70 Discrete Mathematics and Probability Theory 2015》中英字幕

[pytorch] 激活函数（梯度消失）sigmoid，clamp，relu（sparse representation，dying relu）

[pytorch] [求导练习] 04 前向计算与反向传播与梯度更新（forward，loss.backward(), optimizer.step）

【计算机视觉】从图像距离（图像相似性）的计算（ahash/dhash/phash/whash）到以图搜索的实现（deep ranking）（一）

[pytorch 网络拓扑结构] 深入理解 nn.LayerNorm 的计算过程

[不务正业] canvas ctx.getImageData rgba 图像灰度化（gray scale）

[LLMs 实践] 21 llama2 源码分析 GQA：Grouped Query Attention

[LLMs 实践] 19 llama2 源码分析 RoPE apply_rotary_emb 从绝对位置编码到相对位置编码

[蒙特卡洛方法] 02 重要性采样（importance sampling）及 python 实现

【搜索算法】【search】01 python-astar 图上搜索（graph search）f(n)=g(n)+h(n)

[LLMs 实践] 14 llama2 introduction 及 fine tune llama2（guanaco dataset）

【计算机视觉】基于 Siamese network 的图像相似性计算（keras 预训练网络及微调，多输入单输出）

[pytorch 强化学习] 02 将 env rendering 保存为 mp4/gif（以 CartPole 为例，mode='rgb_array'）

[蒙特卡洛方法] 03 接受/拒绝采样（accept/reject samping）初步 cases 分析

[LLMs 实践] 11 gradient accumulation 显存优化 trick

[LLMs 实践] 12 LLM SFT training （trl SFTTrainer、alpaca dataset）

[LLMs 实践] 20 llama2 源码分析 cache KV（keys、values cache）加速推理

[pytorch distributed] nccl 集合通信（collective communication）

【爬虫】【豆瓣爬虫】01 豆瓣热门电影/电视，基于 api 爬虫

【计算机体系结构 cs152 2023】伯克利—中英字幕

[python 全栈] python 装饰器（decorator）及 functools.cache

[LLMs 实践] 04 PEFT/LoRA 源码分析

[LLMs 实践] 17 llama2 源码分析（RMSNorm 与 SwiGLU）

[prompt engineering] 从 CoT 到 ToT（Tree of Thoughts）

【python番外】python函数式编程与闭包与yield关键字

Andrej Karpathy Keynote & Winner Pitches at UCB AI Hackathon 24 Awards Ceremony

[pytorch 强化学习] 07 迷宫环境（maze environment）Q Learning（value iteration）求解（策略关闭 off）

[pytorch 强化学习] 05 迷宫环境（maze environment）策略梯度（Policy Gradient）求解

【数字图像处理】视频关键帧检测（I-frame，P-frame），ffprobe，视频推荐，video embedding

[概率 & 统计] kl div kl散度的计算及应用（pytorch）

【excel数据分析】幂律分布拟合城市GDP（幂律分布 vs. 指数分布 vs. 线性拟合 vs. 多项式拟合）

【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建（代码、数据共享）