V
主页
谷歌公布无需提示工程CoT推理解码算法 #小工蚁
发布人
谷歌公布无需提示工程CoT推理解码算法 #小工蚁
打开封面
下载高清视频
观看高清视频
视频下载器
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁
DSPy提示工程自动优化框架 #小工蚁
大模型提示工程技术 调研报告(上)
谷歌开源视觉大模型PaliGemma
快速掌握提示工程技术Prompting Techniques #小工蚁 #prompt提示工程
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
LLM解码参数Temperature Top K & Top P有啥作用?#小工蚁
通义千问千亿模型比720亿模型更省算力 #小工蚁
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
快速掌握Prompt Engineering #小工蚁 #提示工程 #RWKV
HippoRAG中仿人脑海马体PPR算法实现 #小工蚁
一键拥有你自己的跨平台ChatGPT应用 #小工蚁 #chatgpt
全B站最用心的提示工程词教程,2024最新版,带你7天搞定提示工程,包含所有干货!0基础小白看这套就够了,存下吧,很难找全的!
开源InternLM2大模型测评 #小工蚁
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
掌握提示工程技术:思想树ToT技术,LLM玩24点游戏 #小工蚁 #提示工程
互联网大厂在AI CodeReview代码检查成功实践 #小工蚁
大语言模型提示工程新框架 Self-Discover超越CoT
芯片和人工智能发展趋势(1/2)#小工蚁
NL2SQL大模型生成SQL调研报告
大模型提示工程技术 调研报告(下)
多跳智能问答EfficientRAG更胜一筹 #小工蚁
大语言模型快速JSON解码算法 Jump Forward Decoding #小工蚁
谷歌开源gemma2大语言模型用了啥新技术?
将训练数据打包减少一半大模型训练时间 #小工蚁
构建多模态RAG应用实践 #小工蚁
S-LORA为数千个LoRA同时提供推理,性能提升30倍 #小工蚁
制造业在大模型应用如何实现降本增效 #小工蚁
小工蚁开源大模型解决方案 快速部署,轻松满足定制需求
谷歌:我翻我自己
Jamba1.5开源大模型同等性能降低10倍KV Cache
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
自适应RAG算法和实现
SQLEval Text2SQL能力评估实践 #小工蚁
如何测试大模型推理加速?通义千问和百川2模型测试对比 #小工蚁
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
IRCoT多次推理检索RAG算法 #小工蚁