V
主页
大模型自我改善对齐,无需人类反馈
发布人
大模型自我改善对齐,无需人类反馈
打开封面
下载高清视频
观看高清视频
视频下载器
AutoLabel:自动标注,比人快100倍,准确度和人一样!#小工蚁 #大语言模型
人类反馈强化学习最新替代方法SimPO #小工蚁
ClickHouse和Elastisearch 深度对比
StarCoder2-Instruct自我对齐训练数据合成新方法 #小工蚁
【深度解析】AI大模型scaling law 幂律法则:为什么Scaling Laws重要?对大模型数据量 参数量 算力之间的最优分配!大模型训练的重要指导法则
大模型微调训练实践 准确度10%提升至90%
如何消除大模型幻觉? 提高准确率 LoRA+MoE
阿里发布Text2SQL最新实践开源模型准确度超GPT4
矢量数据库对比和选择指南
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
混合RAG结合向量RAG和图RAG优势在哪里?
从 SAM 到 FastSAM:中科院团队成功实现通用视觉模型速度革命
几百次大模型LoRA和QLoRA 微调实践的经验分享
打造智能客服:LLM和本地 知识库的完美协同原理
百度提出改善RAG准确率新框架Self-Reasoning
大模型算法工程师如何准备面试,大模型岗位面试总结 大模型LLM微调经验总结 卢菁博士老学员大模型面试经验分享
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
DSPy提示工程自动优化框架 #小工蚁
NL2SQL大模型生成SQL调研报告
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
WebGLM:高效网络增强型问答系统,清华开源模型
将训练数据打包减少一半大模型训练时间 #小工蚁
将新鲜知识注入大型语言模型:只需一个命令!#小工蚁 #rome
从零手搓中文大模型计划|Day02|聊一聊Tokenizer,顺带复习下BPE的工作原理
企业大语言模型用什么GPU H100/A100还是4090? #小工蚁
【2024精选大模型教程】只用pytorch ,从零手撸一个大模型,从零训练自己的大模型!大模型源码解读 人工智能大模型入门教程 大模型训练教程 本地部署
清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE
LLM大模型应用场景2:Text2SQL #小工蚁
清华ChatGLM2-6b新模型升级,支持32K上下文的强性能模型!
大模型分布式训练FSDP和DeepSpeed
RAG和LLM原先知识发生冲突时,大模型会怎么做?#小工蚁
将LLaMA3上下文长度从8K扩展 到超过100万
表格式out!大模型最爱JSON,你了解吗?
开源数字人项目SadTalker升级 v0.0.2版本功能介绍和演示
Qwen1.5大模型春节前发布 阿里送大礼包看看有啥?
Vanna开源Text to SQL项目
AutoGPT很火!解决复杂任务 全程无需人类插手
通义千问千亿模型比720亿模型更省算力 #小工蚁
从零手搓中文大模型计划|Day03-04|预训练走起
如何让大语言模型Qwen-7b使用Langchain中的工具? #小工蚁 #qwen7b