【LocalAI】（11）：本地使用CPU运行LocalAI，一次运行5个能力，embedding模型，qwen-1.5-05b模型，生成图模型，语音转文字互转 - 视频下载 Video Downloader

【LocalAI】（11）：本地使用CPU运行LocalAI，一次运行5个能力，embedding模型，qwen-1.5-05b模型，生成图模型，语音转文字互转

发布人

【LocalAI】（11）：本地使用CPU运行LocalAI，一次运行5个能力，embedding模型，qwen-1.5-05b模型，生成图模型，语音转文字互转

git clone https://gitee.com/fly-llm/localai-run-llm.git

# 开启日志，启动全部模型
docker run -p 8080:8080 -e DEBUG=true --name local-ai -it \
-v `pwd`/aio:/aio -v `pwd`/models:/build/models localai/localai:latest-aio-cpu

博客地址：
https://blog.csdn.net/freewebsys/article/details/138744350?spm=1001.2014.3001.5501

打开封面下载高清视频观看高清视频视频下载器

【LocalAI】（9）：本地使用CPU运行LocalAI，一次运行4个大模型，embedding模型，qwen-1.5-05b模型，生成图模型，语音转文字模型

【xinference】（9）：本地使用docker构建环境，一次部署embedding，rerank，qwen多个大模型，成功运行，非常推荐

【LocalAI】（12）：本地使用CPU运行LocalAI，piper语音模型已经切换到了hugging faces上了，测试中文语音包成功！

【LocalAI】（5）：在autodl上使用4090Ti部署LocalAIGPU版本，成功运行qwen-1.5-14b大模型，占用显存8G

【xinference】（7）：在autodl上，使用xinference一次部署embedding，rerank，qwen多个大模型，兼容openai的接口协

【LocalAI】（3）：超级简单！在linux上使用一个二进制文件，成功运行embeddings和qwen-1.5大模型，速度特别快，有gitee配置说明

GPT-SoVITS-V2,0902,并行推理提高速度,字幕同步,接口使用,TTS,声音克隆,文字转语音,花佬开源,ChasonJiang贡献PR

微调MiniCPM-V 2.6实现超强提示词反推｜OpenBMB开放麦Vol.1

【全374集】2024最新清华内部版！终于把AI大模型（LLM）讲清楚了！全程干货讲解，通俗易懂，拿走不谢！

Fish-Speech1.4.1整合包,Windows,修复长文本报错,接口api使用,文字转语音,声音克隆,zero-shot,接入大模型

终于弄明白FastChat服务了，本地部署ChatGLM3，BEG模型，可部署聊天接口，web展示和Embedding服务！

【xinference】（8）：在autodl上，使用xinference部署qwen1.5大模型，速度特别快，同时还支持函数调用，测试成功！

【LocalAI】（4）：在autodl上使用3080Ti部署LocalAIGPU版本，成功运行qwen-1.5-7b大模型，速度特别快，特别依赖cuda版本

【ollama】（2）：在linux搭建环境，编译ollama代码，测试qwen大模型，本地运行速度飞快，本质上是对llama.cpp 项目封装

吴恩达大佬又出新课了！《Hugging Face中的开源模型》双语字幕，16集全，建议收藏！-huggingface、开源模型、吴恩达

【OrangePi】（2）：香橙派OrangePi AIpro设备，安装xinference框架，运行qwen1.5大模型

【LocalAI】（10）：在autodl上编译embeddings.cpp项目，转换bge-base-zh-v1.5模型成ggml格式，本地运行main成功

【LocalAI】（6）：在autodl上使用4090部署LocalAIGPU版本，成功运行qwen-1.5-32b大模型，占用显存18G，速度 84t/s

【ollama】（3）：在linux搭建环境中，安装ollama工具，并且完成启动下载gemma:7b和qwen:1.8b运行速度飞快，支持http接口和命令行

【candle】（4）：使用rsproxy安装rust环境，使用candle项目，成功运行Qwen1.5-0.5B-Chat模型，修改hf-hub下载地址

目前最热门的大模型LLaMa出3.1版本了，跟着同济大佬一口气掌握微调、量化、部署及应用，API无限调用玩转405B超大版本！

大模型LLM-RAG知识库问答实战项目前后端实战课 - Milvus/QWen/ChatGPT/Flask/Tailwindcss

【LocalAI】（7）：在autodl上使用4090D部署，成功部署localai-cuda-12的二进制文件，至少cuda版本是12.4才可以，运行qwen

【Dify知识库】（2）：开源大模型+知识库方案，Dify+fastchat的BGE模型，可以使用embedding接口对知识库进行向量化，绑定聊天应用

CosyVoice整合包(苹果MacOsAppleSilicon),声音克隆,音色融合,字幕同步生成,文字转语音,阿里开源

特别推荐！在modelscope上可以使用免费的CPU和限时的GPU啦，成功安装xinference框架，并部署qwen-1.5大模型，速度7 tokens/s

Yi-VL-34B（5）：使用3个3090显卡24G版本，运行Yi-VL-34B模型，支持命令行和web界面方式，理解图片的内容转换成文字

【大模型知识库】（3）：本地环境运行flowise+fastchat的ChatGLM3模型，通过拖拽/配置方式实现大模型编程，可以使用completions接口

【ollama】（7）：使用Nvidia Jetson Nano设备，成功运行ollama，运行qwen:0.5b-chat，速度还可以，可以做创新项目了

(超爽中英!) 2024公认最全的【吴恩达大模型LLM】系列教程！附代码_LangChain_微调ChatGPT提示词_RAG模型应用_agent_生成式AI

【deepseek】（2）：使用3080Ti显卡，fastchat运行deepseek-coder-6.7b-instruct模型，出现死循环EOT的BUG

【LocalAI】（8）：使用LocalAI镜像，本地使用CPU运行stablediffusion组件，可以生成256x256的图片，生产速度较慢

【LocalAI】（1）：localai项目学习，通过使用docker形式，使用golang+grpc的方式实现本地大模型运行

【xinference】（14）：在compshare上，使用nvidia-docker方式，成功启动推理框架xinference，并运行大模型，非常简单方便

【chatglm3】（8）：模型执行速度优化，在4090上使用fastllm框架，运行ChatGLM3-6B模型，速度1.1w tokens/s，真的超级快。

【ai技术】（4）：在树莓派4上，使用ollama部署qwen0.5b大模型+chatgptweb前端界面，搭建本地大模型聊天工具，速度飞快

【xinference】（11）：在compshare上使用4090D运行xinf和chatgpt-web，部署GLM-4-9B-Chat大模型，占用显存18G

【WPS AI语音速记】录音转文字，AI智能总结！

【ollama】（1）：本地运行大型语言模型（LLM）的新利器，本地运行qwen2-1.5B大模型

【ollama】（5）：在本地使用docker-compose启动ollama镜像，并下载qwen-0.5b模型，速度飞快