V
主页
清华ChatGLM2中英文LLM 2代模型发布,性能大幅提升
发布人
清华ChatGLM2中英文LLM 2代模型发布,性能大幅提升
打开封面
下载高清视频
观看高清视频
视频下载器
清华开源ChatGLM2-6B安装使用 手把手教程,轻松掌握
清华ChatGLM2-6b新模型升级,支持32K上下文的强性能模型!
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡
表格式out!大模型最爱JSON,你了解吗?
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁
训练LLM通过强化学习进行自我纠正 #小工蚁
LangGraph Autogen CrewAI 哪个Agent框架更好?#小工蚁
如何让清华ChatGLM2-6b模型推理性能提升20倍? #小工蚁 #chatglm2
阿里通义千问模型支持vllm,推理速度大幅提升,目前仍有BUG
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁
MOSHI实时对话大模型 有啥技术亮点?
性能媲美CUDA 开源方案助力大模型推理优化 #小工蚁
Jina Embedding v3开源多语言嵌入大模型
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
谷歌开源gemma2大语言模型用了啥新技术?
重磅!ChatGLM2-6B可免费商用,免费中英文大模型有多一种选择 #小工蚁 #chatglm2
OpenAI GPTo1发布告诉我们提升模型性能新途径 强化学习RLAIF #小工蚁
大模型量化技术概述
LLM如何接入到个人微信? 演示群聊中AI自动回复
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20
清华智谱开源视觉大模型 CogVLM,可免费商用
LightLLM轻量级高性能推理框架 和vLLM哪个更强?
Adam-mini适合所有训练过程的优化器大幅降低显存减少33%训练时间
BAdam大模型全参训练方法更省显存,速度更快,性能更优
比较3种开源大模型Roberta Llama2,Mistrial微调性能
DeepSpeed-FastGen比vLLM推理性能快2倍,SplitFuse策略 #小工蚁
清华开源ChatGLM 2代模型演示 轻松实现平滑升级
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
TGI让Huggingface Transformer推理速度提升10倍,本地演示 #小工蚁 #huggingface
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁
阿里发布Text2SQL最新实践开源模型准确度超GPT4
训练大语言模型LLM 如何定义自己训练数据集?#小工蚁
LLM大模型应用场景2:Text2SQL #小工蚁
Qwen2-7B-Instruct不同量化方法准确度和性能比较
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁
投机解码应用于Whisper模型 声音识别速度提升2倍
A16z风投对企业软件最新预测 替代劳动力,前景巨大 #小工蚁
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁