MemLong：提高大模型上下文的“外挂” #小工蚁 - 视频下载 Video Downloader

MemLong：提高大模型上下文的“外挂” #小工蚁

发布人

MemLong：提高大模型上下文的“外挂” #小工蚁

打开封面下载高清视频观看高清视频视频下载器

AutoLabel：自动标注，比人快100倍，准确度和人一样！#小工蚁 #大语言模型

Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁

近期开源VLM大模型介绍 #小工蚁

LangGraph Autogen CrewAI 哪个Agent框架更好？#小工蚁

清华发布SmartMoE一种高效训练专家模型网络算法 #小工蚁 #清华 #MoE

如何让大语言模型Qwen-7b使用Langchain中的工具？ #小工蚁 #qwen7b

LongCite让大模型精准找到引用，智能回答更准确 #小工蚁

OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown

仿人脑海马体HippoRAG智能问答准确度提升 20% #小工蚁

多个大模型哪个输出更好对比工具 #小工蚁

大模型微调训练实践准确度10%提升至90%

中文ChatGLM-6B预训练模型 5.2万提示指令微调演示

大模型推理性能优化策略 #小工蚁

多模态Embedding开源模型 Visualized BGE #小工蚁

开源数字人SadTalker项目源代码解读 #小工蚁 #sadtalker

DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache？

FinGPT: 轻量级适应在金融领域高效LLM解决方案 #小工蚁 #chatglm #chatgpt

LongLoRA长上下文大语言模型的有效微调 #小工蚁

北大开源法律大模型ChatLaw：让法律问题不再复杂 #小工蚁 #ChatLaw

谷歌发现RAG缩放定律释放LLM长上下文潜力提升RAG准确率 #小工蚁

DSPy提示工程自动优化框架 #小工蚁

LLM推理过程中自动缓存KV Cache功能 #小工蚁

书生200亿开源大模型开箱测试如何在2块GPU上运行？ #小工蚁 #开源大模型

M3E中文文本嵌入模型：替代OpenAI text-embedding-ada-002的最佳选择

如何提高垂直领域RAG准确率？ #小工蚁

清华发布CodeGeeX2生成代码大模型，它性能究竟如何？ #小工蚁 #清华 #codegeex

LLaMA-Omni开源语言对话大模型，超低延时 #小工蚁

mBART开源多语言翻译模型支持全球最常用50种语言 #小工蚁

国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁

PDF文档文字、表格混排自动识别，增强RAG应用准确度 #小工蚁

Prefix Caching原理和对大模型推理加速影响 #小工蚁

llama.cpp大神实现投机采样，让大模型推理性能直接翻倍 #小工蚁

介绍GPU最新内核优化GEMM原理 #小工蚁

使用LangChain实现Tool Calling #小工蚁

微调Llama-3 8B模型只需一步 ORPO算法介绍和实践 #小工蚁 #llama3

SalesGPT开源AI销售助理演示和源代码介绍 #小工蚁 #salesgpt

中国企业LLM应用场景有哪些？ #小工蚁

阿里通义开源2个声音大模型SenseVoice和CosyVoice #小工蚁

LLM大模型应用场景2：Text2SQL #小工蚁

最强7B模型Zephyr，打败LlaMA2-70B #小工蚁