llama.cpp + A40 显卡运行 Mixtral 8x7B MoE 量化模型推理速度记录
发布人