7月23日,OpenAI创始成员使用C语言完成对LLaMA 2的推理,该项目可以在MacBook Air M1 CPU上用fp32以每秒18个token的速度生
发布人