V
主页
京东 11.11 红包
【RLChina论文研讨会】第80期 庞竟成 不懂就问:主动询问有助于提升大语言模型回答质量
发布人
打开封面
下载高清视频
观看高清视频
视频下载器
前两天面了个大模型工程师,开始感觉很不错,可是工作几天。。。
【RLChina论文研讨会】第87期 盛俊杰 语言智能体可以作为PPO的替代吗?一个在OpenAI Gym上的初步研究
【RLChina论文研讨会】第80期 冯加恒 离线到在线强化学习中的稳定化无约束微调
【RLChina论文研讨会】第93期 张宗萌 Trustworthy Alignment of Retrieval-Augmented Large Langua
复旦+米哈游联合推出 :LLM agent研究!原神级的AI小镇究竟长什么样?
【RLChina论文研讨会】第88期 张谷 Learning Dexterous Robot Manipulation Skills Based On 3D V
【RLChina论文研讨会】第89期 贾乘兴 Offline Transition Modeling via Contrastive Energy Learni
【RLChina论文研讨会】第83期 曾勇程 Token-level Direct Preference Optimization
【RLChina论文研讨会】第72期 马纬彧 大模型玩转星际 新的基准和总结链的尝试
社交很快乐的 你试一下呢
【RLChina论文研讨会】第60期 张策尧 使用大型语言模型构建主动协作人工智能
【RLChina论文研讨会】第93期 王治海 基于分层自适应多任务强化学习框架的乘法电路自动设计
【RLChina论文研讨会】第96期 陈逸彬 SheetAgent:基于大型语言模型的通用型表格推理与操作智能体
【RLChina论文研讨会】第83期 叶语霄 LLM-based Text2SQL:new SOTA and comprehensive benchmarkin
【RLChina论文研讨会】第88期 胡开哲 Affordance Generalization Beyond Categories via Semantic
沈腾教你一句话取消APP自动续费!
【RLChina 2023】 专题报告六:基于大语言模型的开放世界智能决策 杨耀东
腾讯大模型岗面试好强啊,真的hold不住了!
【RLChina论文研讨会】第81期 曲云 一种基于真实王者荣耀游戏的离线强化学习数据集
【RLChina论文研讨会】第97期 胡昊 基于贝叶斯原则的离线到在线强化学习
练完这些项目,天下没有再难倒你的大模型!
印度的ai视频原版,真的难崩🤣
【RLChina论文研讨会】第82期 胡梦康 Tree-Planner:Efficient Close-loop Task Planning with
【RLChina论文研讨会】第78期 胡紫灿 多智能体强化学习中基于注意力的对比角色表征
【RLChina论文研讨会】第43期 庄梓峰 行为近端策略优化
【RLChina论文研讨会】第70期 朱文轩 基于观察数据的深度因果强化学习
我的教授获了2024诺奖、解析他的获奖工作
【RLChina论文研讨会】第90期 徐圣 Robust Inverse Constrained Reinforcement Learning under Mo
【RLChina论文研讨会】第97期 陈华玉 Score Regularized Policy Optimization through Diffusion B
【RLChina论文研讨会】第62期 冯悦 A Large Language Model Enhanced Conversational Recommender
【RLChina论文研讨会】第69期 黄红蓝 Active Client Selection for Clustered Federated Learning
Qwen-2.5中文写作LoRA,指令微调,绅士小说续写,提供guff文件
【RLChina论文研讨会】第73期 史紫荆 文字冒险游戏中的道德决策制定
【RLChina论文研讨会】第89期 邱文杰 Debiased Offline Representation Learning for Fast Online
【RLChina论文研讨会】第62期 林浩鑫 Model-based Reinforcement Learning with Multi-step Plan
【RLChina论文研讨会】第49期 刘梓辰 Efficient Offline Policy Optimization with a Learned Mode
【RLChina论文研讨会】第76期 董恒 基于双曲表征的多细胞机器人设计
【RLChina论文研讨会】第68期 阳明宇 分层多智能体技能发现
【RLChina论文研讨会】第57期 罗俊仁 博弈决策视角下的“外交风云”多人博弈AI实证分析
【RLChina论文研讨会】第42期 徐浩添 基于群体强化学习的质量相似多样性