V
主页
使用长上下文嵌入模型实现 延迟划块,提高RAG准确率
发布人
使用长上下文嵌入模型实现延迟划块,提高RAG准确率
打开封面
下载高清视频
观看高清视频
视频下载器
阿里巴巴最强开源大模型Qwen2.5-72B-Instruct,击败Llama3.1-405B!Qwen2.5+LlamaIndex实现Text to SQL
llama3.2本地模型搭建自纠错RAG agent,自动纠正不相关RAG提取内容,完全本地
【中英精校】最好的 RAG 技术?| Anthropic 的上下文检索技术!| 2024.10.03
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
构建多模态RAG应用实践 #小工蚁
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
「Github一周热点39期」开源RAG UI、AI证件照、开源免费ERP等5个项目
【喂饭教程】Anything+Ollama零成本搭建本地知识库,免费、无限制、保护隐私、无需网络~小白入门必看的保姆级教程!
多模态RAG检索增强生成2种实现方式 #小工蚁
Jina Embedding v3开源多语言嵌入大模型
BAdam大模型全参训练方法更省显存,速度更快,性能更优
RAPTOR一种树结构检索的RAG算法 #小工蚁
Qwen2-7B-Instruct不同量化方法准确度和性能比较
(超爽中英!) 2024公认最好的【吴恩达LangChain+RAG】教程!更适合中国宝宝体质,全程干货无废话,学完成为AGI大佬!(附课件+代码)
全球首款会自我纠错的大模型-Reflection-Llama3.1-70b!超强推理能力挑战高难度推理题!AutoGen+LlamaIndex打造智能RAG
BCE Embedding开源大模型 RAG应用准确度提升关键
本地部署开源模型使用反思的思想优化RAG 效果
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
【RAG质量提升实战】基于Claude的基于上下文检索 | Contextual Retrieval
Meta发布开源大模型Llama 3.2 | Ollama与Groq也支持3.2啦!
MEMORAG受记忆启发知识发现的下一代RAG #小工蚁 #rag
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
使用LangChain实现Tool Calling #小工蚁
【更新提醒】大模型RAG实战项目 Langchain + ElasticSearch + Docker 本地化部署
HyKGE:如何利用知识图谱助力 RAG在医学领域提升准确度
milvus向量数据库的基本使用方式
大模型自我改善对齐,无需人类反馈
VLM多模态开源大模型发展迅速 下半年将成为主流
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
RAG 和 Agent 的本质区别是什么?
开源项目moffee 将markdown格式转为PPT #小工蚁
LangChain实现基于Claude的Contextual Retrieval | 基于上下文检索
Liger Kernel开源加速大模型训练 算子,降低60%GPU显存
大模型微调训练实践 准确度10%提升至90%
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
如何快速下载Huggingface大模型权重?#小工蚁