V
主页
[pygame Astar寻路算法可视化] 04 A star 算法优先级队列,f = g + h
发布人
https://github.com/chunhuizhang/bilibili_vlogs/blob/master/path_finding/tutorials/03_astar.py
打开封面
下载高清视频
观看高清视频
视频下载器
CSP-J2024入门级复赛真题讲解【2024CSP入门级第二轮 关注AcKing公众号获取真题解析和源码】
【细思极恐】比挂科更可怕的是:你正在被大学毁掉!
[蒙特卡洛方法] 04 重要性采样补充,数学性质及 On-policy vs. Off-policy
[pygame Astar寻路算法可视化] 03 A star算法初始化及有效邻域的计算
【删前必看】在大学装孙子3年后,现在后悔得想死....
【搜索算法】【search】01 python-astar 图上搜索(graph search)f(n)=g(n)+h(n)
财税人的🔍引擎,超好用的5个搜法规方式~
[pytorch distributed] 张量并行与 megtron-lm 及 accelerate 配置
【搜索算法】【search】02 爬山算法(hill climbing)二维离散空间上的邻域搜索
[pytorch distributed] deepspeed 基本概念、原理(os+g+p)
[LangChain] 04 LangGraph 构建复杂 RAG workflow(Self-corrective)
[mcts] 01 mcts 基本概念基本原理(UCB)及两个示例
[全栈深度学习] 01 docker 工具的基本使用及 nvidia cuda pytorch 镜像
[优化算法] 梯度下降、共轭梯度、牛顿法、逆牛顿法(BFGS)
【会计】个人所得税速算扣除数的计算及推导
[DRL] 从 TRPO 到 PPO(PPO-penalty,PPO-clip)
B站搜什么都能搜出来伊朗被抢劫视频
[LangChain] 03 LangGraph 基本概念(AgentState、StateGraph,nodes,edges)
[RLHF] 从 PPO rlhf 到 DPO,公式推导与原理分析
[矩阵分析] 旋转矩阵的计算机与应用(复平面,RoPE)
[强化学习基础 02] MDP价值迭代算法(value iteration,V(s), Q(s,a), pi(s))
[python 多进程、多线程] 03 GIL、threading、多进程,concurrent.futures
[mcts] 02 mcts from scartch(UCTNode,uct_search, pUCT,树的可视化)
[pytorch 强化学习] 04 迷宫环境(maze environment)封装 MazeEnv、Agent 类
[gpt2 番外] training vs. inference(generate),PPL 计算,交叉熵损失与 ignore_index
[pygame Astar寻路算法可视化] 01 pygame 初始化及 grid world 创建
【计算机视觉】从图像距离(图像相似性)的计算(ahash/dhash/phash/whash)到以图搜索的实现(deep ranking)(一)
[AI Agent] llama_index RAG 原理及源码分析
【python 信号与系统】02 scipy.signal.convolve2d 二维(图像)卷积及其与 CNN 的区别
[动手写bert系列] 01 huggingface tokenizer (vocab,encode,decode)原理及细节
[番外] float16 与 bf16 表示和计算细节
[模型拓扑接口] 经典 RNN 模型(一)模型参数及训练参数的介绍
[diffusion] 生成模型基础 VAE 原理及实现
[pytorch] 激活函数,从 ReLU、LeakyRELU 到 GELU 及其梯度(gradient)(BertLayer,FFN,GELU)
[personal chatgpt] trl rlhf PPOTrainer,原理分析与代码走读(OpenRLHF framework)
[LangChain] 02 conversational agents,ReAct、agent_scratchpad 历史过程信息维护
[纳什荐书][生成式AI] 01 《GPT图解》导读
【python app 开发】01 使用 tkinter 及 pyinstaller 制作一个简单的日期管理软件
[pytorch 强化学习] 08 CartPole Q learning 连续状态离散化(digitize 分桶)及 display_frame_as_gif
[AI 核心概念及计算] 概率计算 01 pytorch 最大似然估计(MLE)伯努利分布的参数