V
主页
[prompt engineering] 从 CoT 到 ToT(Tree of Thoughts)
发布人
本期 code:https://github.com/chunhuizhang/llm_aigc/blob/main/tutorials/prompt_engineering/tot_tree_of_thought.ipynb
打开封面
下载高清视频
观看高清视频
视频下载器
思维链CoT(Chain of Thought)-O1底层算法优化思路
【回归分析】R2(coefficient of determination)的定义及计算(SSres、SStot)及图形化解释(graphical expla)
[pytorch 强化学习] 10 从 Q Learning 到 DQN(experience replay 与 huber loss / smooth L1)
[AI Agent] Agentic Reasoning & workflow工作流,及translation-agent 一个具体的 agent 项目
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
【python 运筹优化】scipy.optimize.minimize 使用
[Python 机器学习] 深入理解 numpy(ndarray)的 axis(轴/维度)
[pytorch distributed] 01 nn.DataParallel 数据并行初步
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[番外] float16 与 bf16 表示和计算细节
[LLMs 实践] 06 LLaMA,Alpaca LoRA 7B 推理
[pytorch 强化学习] 12 逐行写代码实现 DQN 完全体
[leetcode reviews] 01 计算思维与刷题方法
[调包侠] tencent ailab 中文语料 embedding vector(word2vec)
[动手写神经网络] 手动实现 Transformer Encoder
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[蒙特卡洛方法] 01 从黎曼和式积分(Reimann Sum)到蒙特卡洛估计(monte carlo estimation)求积分求期望
【计算机视觉】从图像距离(图像相似性)的计算(ahash/dhash/phash/whash)到以图搜索的实现(deep ranking)(一)
【统计学】从置信水平(confidence level,置信区间)、Z值到最小采样数(最小抽样数)
[generative models] 概率建模视角下的现代生成模型(生成式 vs. 判别式,采样与密度估计)
[蒙特卡洛方法] 02 重要性采样(importance sampling)及 python 实现
[pytorch] [求导练习] 06 计算图(computation graph)细节之 retain graph(multi output/backwar)
[pytorch] nn.Embedding 前向查表索引过程与 one hot 关系及 max_norm 的作用
[矩阵分析] 分块矩阵的角度理解矩阵运算(独热向量与对角矩阵)
[LLM & AIGC] 03 openai embedding (text-embedding-ada-002)基于 embedding 的文本语义匹配
[QKV attention] flash attention(Tiling与重计算),operation fused,HBM vs. SRAM
[工具的使用] python jupyter 环境安装配置拓展(nbextension)(ExcecuteTime:执行时间,Table of Content)
[python 多进程、多线程以及协程] 01 关于进程(multiprocessing,pid、ppid)
[DRL] 从策略梯度到 TRPO(Lagrange Duality,拉格朗日对偶性)
【统计学】p-value(p值) 与 z-score(标准分/z得分/z分数)定义,计算以及适用场景
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
[不务正业] canvas ctx.getImageData rgba 图像灰度化(gray scale)
[数据可视化] 绘制交互式 3d plot(interactive 3d plot, Axes3d) z=f(x, y) (三维空间中的 surface)
[概率 & 统计] Thompson Sampling(随机贝叶斯后验采样)与多臂老虎机
[调包侠] 使用 PyTorch Swin Transformer 完成图像分类
[pytorch] 多项式分布及采样(torch.multinomial, torch distribution Categorical)