[pygame Astar寻路算法可视化] 04 A star 算法优先级队列，f = g + h - 视频下载 Video Downloader

[pygame Astar寻路算法可视化] 04 A star 算法优先级队列，f = g + h

发布人

https://github.com/chunhuizhang/bilibili_vlogs/blob/master/path_finding/tutorials/03_astar.py

打开封面下载高清视频观看高清视频视频下载器

CSP-J2024入门级复赛真题讲解【2024CSP入门级第二轮关注AcKing公众号获取真题解析和源码】

【细思极恐】比挂科更可怕的是：你正在被大学毁掉！

[蒙特卡洛方法] 04 重要性采样补充，数学性质及 On-policy vs. Off-policy

[pygame Astar寻路算法可视化] 03 A star算法初始化及有效邻域的计算

【删前必看】在大学装孙子3年后，现在后悔得想死....

【搜索算法】【search】01 python-astar 图上搜索（graph search）f(n)=g(n)+h(n)

财税人的🔍引擎，超好用的5个搜法规方式～

[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置

【搜索算法】【search】02 爬山算法（hill climbing）二维离散空间上的邻域搜索

[pytorch distributed] deepspeed 基本概念、原理（os+g+p）

[LangChain] 04 LangGraph 构建复杂 RAG workflow（Self-corrective）

[mcts] 01 mcts 基本概念基本原理（UCB）及两个示例

[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像

[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法（BFGS）

【会计】个人所得税速算扣除数的计算及推导

[DRL] 从 TRPO 到 PPO（PPO-penalty，PPO-clip）

B站搜什么都能搜出来伊朗被抢劫视频

[LangChain] 03 LangGraph 基本概念（AgentState、StateGraph，nodes，edges）

[RLHF] 从 PPO rlhf 到 DPO，公式推导与原理分析

[矩阵分析] 旋转矩阵的计算机与应用（复平面，RoPE）

[强化学习基础 02] MDP价值迭代算法（value iteration，V(s), Q(s,a), pi(s)）

[python 多进程、多线程] 03 GIL、threading、多进程，concurrent.futures

[mcts] 02 mcts from scartch（UCTNode，uct_search, pUCT，树的可视化）

[pytorch 强化学习] 04 迷宫环境（maze environment）封装 MazeEnv、Agent 类

[gpt2 番外] training vs. inference（generate），PPL 计算，交叉熵损失与 ignore_index

[pygame Astar寻路算法可视化] 01 pygame 初始化及 grid world 创建

【计算机视觉】从图像距离（图像相似性）的计算（ahash/dhash/phash/whash）到以图搜索的实现（deep ranking）（一）

[AI Agent] llama_index RAG 原理及源码分析

【python 信号与系统】02 scipy.signal.convolve2d 二维（图像）卷积及其与 CNN 的区别

[动手写bert系列] 01 huggingface tokenizer （vocab，encode，decode）原理及细节

[番外] float16 与 bf16 表示和计算细节

[模型拓扑接口] 经典 RNN 模型（一）模型参数及训练参数的介绍

[diffusion] 生成模型基础 VAE 原理及实现

[pytorch] 激活函数，从 ReLU、LeakyRELU 到 GELU 及其梯度（gradient）（BertLayer，FFN，GELU）

[personal chatgpt] trl rlhf PPOTrainer，原理分析与代码走读（OpenRLHF framework）

[LangChain] 02 conversational agents，ReAct、agent_scratchpad 历史过程信息维护

[纳什荐书][生成式AI] 01 《GPT图解》导读

【python app 开发】01 使用 tkinter 及 pyinstaller 制作一个简单的日期管理软件

[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化（digitize 分桶）及 display_frame_as_gif

[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计（MLE）伯努利分布的参数