V
主页
安装最新开源的MiniCPM-V 2.6多模态模型智能识别图片和视频
发布人
模型下载地址: https://modelscope.cn/models/OpenBMB/MiniCPM-V-2_6-gguf/files llama.cpp源代码: 网盘:https://pan.quark.cn/s/cef17987b38c 安装文档: 1.克隆代码 git clone https://github.com/OpenBMB/llama.cpp.git cd llama.cpp git checkout minicpmv-main 或者从网盘下载llama.cpp文件夹 2.安装编译环境 apt update && apt install -y libavcodec-dev libavformat-dev libswscale-dev ffmpeg pkg-config make gcc g++ git 3.编译代码 cd llama.cpp make 4.识别图片 非交互式: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --image /home/titan/Downloads/test.jpg -p "请描述一下这张图片的场景内容" 交互式: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --image /home/titan/Downloads/test.jpg -i 5.识别视频: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --video /home/titan/Downloads/test.mp4 -p "描述一下这段视频"
打开封面
下载高清视频
观看高清视频
视频下载器
手机安装MiniCPM-V-2.5多模态大模型(无需联网)
安装测试MiniCPM-Llama3-V2.5多模态模型图像识别能力
【强烈推荐】开源的AI驱动的OCR文字识别神器开启OCR2.0时代(GOT-OCR2.0)
ollama支持Llama3.2-vision多模态大模型轻松实现监控找人!重磅分享:详细讲解提示词工程+视觉大模型实现视频目标查找!无需高端显卡,本地运行流畅
4060Ti 16G显卡安装Qwen2-VL多模态模型识别视频/图片效果及安装注意事项
安装Ollama+CosyVoice打造流式智能语音秘书,流式生成语音大大缩短了等待时间,提升用户体验
一键运行开源Qwen2-Audio大模型体验声音识别与语音输入
安装开源的CosyVoice三秒完美复刻声音(TTS)
实测4060Ti 16G vs 4070Ti SUPER运行AI(人工智能)性能对比
手机安装运行最新开源的Qwen2-7B-Instruct大语言模型(可断网使用)
沉浸体验4060Ti 16G显卡运行Qwen2.5大模型的效果
4060Ti 16G显卡安装Ollama+ChatTTS打造智能语音秘书(突破30秒限制)
4060Ti16G显卡安装开源文生视频CogVideoX模型(AI生成视频)
安装开源的SenseVoice实现比Whisper更快更精准的语音转文字
手把手教你把小米音箱接入AI大模型打造你的智能语音助手(支持公共模型和私有模型)
组装一台4090显卡的电脑用于AI(人工智能)模型训练
超简单的检测Intel13/14代CPU是否存在不稳定的方法(官方推荐) 赶快检测一下自己的CPU避免造成不可逆的伤害
mlc-llm替换ollama部署最新开源的Llama-3.1大模型(可在树莓派上部署)
4060Ti 16G显卡安装EasyPhoto利用AI生成视频
安装Whisper、GLM-4、ChatTTS打造你的智能语音助手
实测RTX4090 vs A100运行AI(人工智能)性能对比
将Qwen1.5大模型编译成手机可以运行的大模型
最新开源的Llama3.1大模型能否在Android上运行?Yes!
4060Ti 16G显卡安装通义千问Qwen1.5-14B大模型
4060Ti 16G显卡安装腾讯开源的混元DiT文生图AI模型,这回可以用中文咒语生图了
小米14安装运行Qwen1.5-14B开源大语言模型(无需联网)
小米14安装运行Qwen1.5-7B开源大语言模型(无需联网)
Qwen2.5+Gemma2双剑合璧让手机变得更智能
4060Ti 16G显卡安装Reor+Qwen1.5-14B打造AI智能秘书
微调训练大语言模型并将训练好的模型装入手机运行
Windows离线安装QAnything打造智能客服系统以及常见安装问题的解决方法
Linux不刷新BIOS也能解决英特尔13/14代cpu不稳定的问题
一键优化sadtalker生成的AI虚拟人口型
骁龙870处理器的老手机安装运行Qwen1.5大语言模型(可断网使用)
国产麒麟操作系统1.0正式版的安装和办公感受
4060Ti 16G显卡安装零一万物最新开源的Yi-1.5版大语言模型
给英特尔13/14代处理器续命-更新0x129微码BIOS全过程
4060Ti 16G显卡运行chatglm3-6b-32k模型效果
手机利用NLLB和Whisper开源AI模型变身多语言翻译-RTranslator(可断网使用)
StableDiffusion3无需安装解压即用(WebUI适合新手使用)