【RLChina论文研讨会】第80期庞竟成不懂就问：主动询问有助于提升大语言模型回答质量 - 视频下载 Video Downloader

京东 11.11 红包

【RLChina论文研讨会】第80期庞竟成不懂就问：主动询问有助于提升大语言模型回答质量

发布人

打开封面下载高清视频观看高清视频视频下载器

前两天面了个大模型工程师，开始感觉很不错，可是工作几天。。。

【RLChina论文研讨会】第87期盛俊杰语言智能体可以作为PPO的替代吗？一个在OpenAI Gym上的初步研究

【RLChina论文研讨会】第80期冯加恒离线到在线强化学习中的稳定化无约束微调

【RLChina论文研讨会】第93期张宗萌 Trustworthy Alignment of Retrieval-Augmented Large Langua

复旦+米哈游联合推出：LLM agent研究！原神级的AI小镇究竟长什么样？

【RLChina论文研讨会】第88期张谷 Learning Dexterous Robot Manipulation Skills Based On 3D V

【RLChina论文研讨会】第89期贾乘兴 Offline Transition Modeling via Contrastive Energy Learni

【RLChina论文研讨会】第83期曾勇程 Token-level Direct Preference Optimization

【RLChina论文研讨会】第72期马纬彧大模型玩转星际新的基准和总结链的尝试

社交很快乐的你试一下呢

【RLChina论文研讨会】第60期张策尧使用大型语言模型构建主动协作人工智能

【RLChina论文研讨会】第93期王治海基于分层自适应多任务强化学习框架的乘法电路自动设计

【RLChina论文研讨会】第96期陈逸彬 SheetAgent：基于大型语言模型的通用型表格推理与操作智能体

【RLChina论文研讨会】第83期叶语霄 LLM-based Text2SQL：new SOTA and comprehensive benchmarkin

【RLChina论文研讨会】第88期胡开哲 Affordance Generalization Beyond Categories via Semantic

沈腾教你一句话取消APP自动续费！

【RLChina 2023】专题报告六：基于大语言模型的开放世界智能决策杨耀东

腾讯大模型岗面试好强啊，真的hold不住了！

【RLChina论文研讨会】第81期曲云一种基于真实王者荣耀游戏的离线强化学习数据集

【RLChina论文研讨会】第97期胡昊基于贝叶斯原则的离线到在线强化学习

练完这些项目，天下没有再难倒你的大模型！

印度的ai视频原版，真的难崩🤣

【RLChina论文研讨会】第82期胡梦康 Tree-Planner：Efficient Close-loop Task Planning with

【RLChina论文研讨会】第78期胡紫灿多智能体强化学习中基于注意力的对比角色表征

【RLChina论文研讨会】第43期庄梓峰行为近端策略优化

【RLChina论文研讨会】第70期朱文轩基于观察数据的深度因果强化学习

我的教授获了2024诺奖、解析他的获奖工作

【RLChina论文研讨会】第90期徐圣 Robust Inverse Constrained Reinforcement Learning under Mo

【RLChina论文研讨会】第97期陈华玉 Score Regularized Policy Optimization through Diffusion B

【RLChina论文研讨会】第62期冯悦 A Large Language Model Enhanced Conversational Recommender

【RLChina论文研讨会】第69期黄红蓝 Active Client Selection for Clustered Federated Learning

Qwen-2.5中文写作LoRA,指令微调,绅士小说续写，提供guff文件

【RLChina论文研讨会】第73期史紫荆文字冒险游戏中的道德决策制定

【RLChina论文研讨会】第89期邱文杰 Debiased Offline Representation Learning for Fast Online

【RLChina论文研讨会】第62期林浩鑫 Model-based Reinforcement Learning with Multi-step Plan

【RLChina论文研讨会】第49期刘梓辰 Efficient Offline Policy Optimization with a Learned Mode

【RLChina论文研讨会】第76期董恒基于双曲表征的多细胞机器人设计

【RLChina论文研讨会】第68期阳明宇分层多智能体技能发现

【RLChina论文研讨会】第57期罗俊仁博弈决策视角下的“外交风云”多人博弈AI实证分析

【RLChina论文研讨会】第42期徐浩添基于群体强化学习的质量相似多样性