V
主页
曾是谷歌高级研究科学家,将于2024年1月加入华盛顿大学计算机系任助理教授【社会强化学习】——娜塔莎·雅克
发布人
YouTube 曾是谷歌高级研究科学家,将于2024年1月加入华盛顿大学计算机系任助理教授【社会强化学习 Social Reinforcement Learning】——娜塔莎·雅克 Natasha Jaques @徐芝兰
打开封面
下载高清视频
观看高清视频
视频下载器
华盛顿大学《机器学习(回归,第2课/共4课)|Machine Learning》中英字幕
华盛顿大学《动态公共演讲(信息性演讲,劝说性演讲,激励性演讲,第2、3、4课,共4课)|Dynamic Public Speaking》英中字幕
统计最高奖得主、华盛顿大学教授【图模型结构的学习 Learning the Structure of a Graphical Model】——丹妮拉·威滕
【DQN强化学习】超清晰!入门强化学习最好的书籍!多伦多爆火强化学习导论课程!—深度学习/神经网络/深度强化学习
华盛顿大学《机器学习(基础篇,第1课/共4课)|Machine Learning》中英字幕
【模特姐姐教你数据库管理系统导论 Introduction to Database Management Systems】——林郁珊(Yusan Lin)
太完整了吧!一口气带你学完【机器学习+深度学习+强化学习】不愧是计算机大佬亲授!真的太通俗易懂了!建议收藏!(人工智能、深度学习、神经网络、图像处理、AI)
【一次带你打通关统计推断基础(1)】——威尔·菲西安(Will Fithian, 加州大学伯克利分校统计系教授)
B站强推!2024公认最通俗易懂的【AI大模型】教程,24集付费课程(附资料)LLM大模型_RAG_大模型微调_多模态
想了解顶级统计学家都在做什么,各大统计方向的板块关系吗? 这个视频为你揭晓.【统计学三角The statistics triangle】——CMU教授金家顺
【自监督学习 Self-supervised learning】——马腾宇(斯坦福大学计算机科学与统计学的助理教授)
【黑马博学谷2024】AI大模型训练营1期
16大模型全栈-强化学习09-DPO变体:TDPO:更细粒度控制的DPO;RPO:带有离线奖励的DPO
【贝叶斯 VS 频率学派: 斯通悖论 (Stone’s Paradox)】——拉里·沃瑟曼 Larry Wasserman
吹爆!这可能是麻省理工最出名的线性代数教程了,想学好线代一定不能错过的《线性代数可视化手册》,看完还学不会你来锤爆我!人工智能|数学基础
【贝叶斯数据分析全打通(3)】——宋心远(香港中文大学统计系教授)
不愧是王树森老师讲的【深度强化学习】,零基础入门到实战完整版教程!—DRL、深度强化学习、强化学习、王树森、计算机技术
【计算机编程 cse142 2020】华盛顿大学—中英字幕
吹爆!人工智能从入门到精通:Python基础+数学基础机器学习+深度学习+强化学习,涵盖所有基础知识及项目实战,AI新手必备!
【实用的统计诊断方法(着重于受试者工作特征曲线ROC Curve)】——范德堡大学教授Frank Harrell
【贝叶斯网络 Bayesian Network】
【马尔可夫链蒙特卡罗方法(2) (Markov chain Monte Carlo,MCMC) 】——张颢(清华大学)
【变分贝叶斯及其他-大规模的贝叶斯推断(ICML 2018)】
【一致最小方差无偏估计Best Estimators】—亚利桑那大学教授Joseph C. Watkins
华盛顿大学《动态公共演讲(公开演讲简介,第1课,共4课)|Dynamic Public Speaking》英中字幕
【贝叶斯数据分析全打通(2)】——宋心远(香港中文大学统计系教授)
都2024年了!你还不会用Chrome谷歌浏览器?
Isaaclab强化学习训练仿真:未来的丧尸电影还需要群演吗?
【在顶级研究团队是什么感受?听美女科学家讲在DeepMind工作和在Google Brain(谷歌大脑)工作的不同】
【通过 PAC-Bayes 研究深度学习中的泛化问题】—金塔尔·卡罗琳娜·吉盖特 Gintare Karolina Dziugaite
【凸优化一览】——瑞安·亚当斯 Ryan P. Adams(普林斯顿大学)
正则化Regularization I (一次带你打通关Lasso, Elastic Net, Adaptive Lasso, SCAD, MCP)
《模式识别与机器学习– PRML》作者,【图模型(1) Graphical Models】—Christopher Michael Bishop
ORCA SIM 仿真平台再升级,支持mujoco物理引擎,openai gym 强化学习训练框架😎
【AdaPT: 利用辅助信息进行多重检验的动态方法】——雷理骅(斯坦福大学)
【深度学习:感知器、反向传播 Deep Learning:Perceptron, Backpropagation】——Ali Ghodsi
2024年世界人工智能大会(WAIC)之人形机器人展台合集
09大模型全栈-强化学习02-RLHF前言LLM强化学习
美国三院院士/机器学习超级大佬【共形预测Conformal Prediction】—加州大学伯克利分校教授Michael I. Jordan
10大模型全栈-强化学习03-RLHF原理以及流程介绍