V
主页
京东 11.11 红包
安装最新开源的MiniCPM-V 2.6多模态模型智能识别图片和视频
发布人
模型下载地址: https://modelscope.cn/models/OpenBMB/MiniCPM-V-2_6-gguf/files llama.cpp源代码: 网盘:https://pan.quark.cn/s/cef17987b38c 安装文档: 1.克隆代码 git clone https://github.com/OpenBMB/llama.cpp.git cd llama.cpp git checkout minicpmv-main 或者从网盘下载llama.cpp文件夹 2.安装编译环境 apt update && apt install -y libavcodec-dev libavformat-dev libswscale-dev ffmpeg pkg-config make gcc g++ git 3.编译代码 cd llama.cpp make 4.识别图片 非交互式: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --image /home/titan/Downloads/test.jpg -p "请描述一下这张图片的场景内容" 交互式: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --image /home/titan/Downloads/test.jpg -i 5.识别视频: ./llama-minicpmv-cli -m /home/titan/Downloads/ggml-model-f16.gguf --mmproj /home/titan/Downloads/mmproj-model-f16.gguf -c 4096 --temp 0.7 --top-p 0.8 --top-k 100 --repeat-penalty 1.05 --video /home/titan/Downloads/test.mp4 -p "描述一下这段视频"
打开封面
下载高清视频
观看高清视频
视频下载器
安装测试MiniCPM-Llama3-V2.5多模态模型图像识别能力
手机安装MiniCPM-V-2.5多模态大模型(无需联网)
4060Ti 16G显卡安装Qwen2-VL多模态模型识别视频/图片效果及安装注意事项
一键运行开源Qwen2-Audio大模型体验声音识别与语音输入
【强烈推荐】开源的AI驱动的OCR文字识别神器开启OCR2.0时代(GOT-OCR2.0)
4060Ti16G显卡安装开源文生视频CogVideoX模型(AI生成视频)
手机安装运行最新开源的Qwen2-7B-Instruct大语言模型(可断网使用)
手机安装Meta最新开源的Llama3大语言模型(无需联网)
安装开源的CosyVoice三秒完美复刻声音(TTS)
安装Whisper、GLM-4、ChatTTS打造你的智能语音助手
实测4060Ti 16G vs 4070Ti SUPER运行AI(人工智能)性能对比
4060Ti 16G显卡安装零一万物最新开源的Yi-1.5版大语言模型
mlc-llm替换ollama部署最新开源的Llama-3.1大模型(可在树莓派上部署)
最新开源的Llama3.1大模型能否在Android上运行?Yes!
详细的QAnything v2.0整合Qwen2.5大模型打造智能客服教程【包含安装配置中的坑点和配置优化】
小米14安装运行Qwen1.5-7B开源大语言模型(无需联网)
安卓手机本地运行谷歌最新开源的Gemma2大模型
Windows安装网易开源QAnything打造智能客服系统
小米14安装运行Qwen1.5-14B开源大语言模型(无需联网)
手把手教你把小米音箱接入AI大模型打造你的智能语音助手(支持公共模型和私有模型)
4060Ti 16G显卡安装网易开源QAnything打造智能问答知识库
手机安装使用最新开源的Qwen2大语言模型(可断网使用)
4060Ti 16G显卡安装EasyPhoto利用AI生成视频
安装开源的SenseVoice实现比Whisper更快更精准的语音转文字
点几下鼠标模糊图片变清晰的开源免费AI工具
骁龙870处理器的老手机安装运行Qwen1.5大语言模型(可断网使用)
4060Ti 16G显卡安装Reor+Qwen1.5-14B打造AI智能秘书
Windows离线安装QAnything打造智能客服系统以及常见安装问题的解决方法
实测RTX4090 vs A100运行AI(人工智能)性能对比
StableDiffusion3无需安装解压即用(WebUI适合新手使用)
4060Ti 16G显卡安装腾讯开源的混元DiT文生图AI模型,这回可以用中文咒语生图了
一键安装sadtalker打造自己的AI数字虚拟人
4060Ti 16G显卡安装通义千问Qwen1.5-14B大模型
4060Ti 16G显卡安装谷歌开源大模型Gemma-7B
4060Ti 16G显卡运行百川2-13B大模型效果
沉浸体验4060Ti 16G显卡运行Qwen2.5大模型的效果
将Qwen1.5大模型编译成手机可以运行的大模型
4060Ti 16G显卡一键部署AI数学家教
4060Ti 16G显卡运行chatglm3-6b-32k模型效果
4060Ti 16G显卡安装通义千问Qwen-VL视觉语言模型