V
主页
GOT-OCR-2-GUI - 一个强大的AI文本识别模型 OCR文字识别 图片文字识别 本地一键整合包下载
发布人
免费下载地址:https://deepface.cc/thread-411-1-1.html 今天分享的就是GOT-OCR的GUI版本,支持的场景比如文本、文档、乐谱、图表、数学公式等内容识别
打开封面
下载高清视频
观看高清视频
视频下载器
Hallo2 - 复旦、百度联手推出全新AI数字人模型 可生成4K超高清+1小时超长视频 本地一键整合包下载
【Python教程】教你用Python实现超精准且免费识别图片中的文字,零基础小白也能学会!附源码
一款完全免费的OCR软件,无需安装,一键识别文字、图片,离线可用,快至毫秒级!
OCR文字识别,功能丰富使用简单,支持截图+OCR图片识别,一键安装永久使用!
PDF转Markdown,新版MinerU整合包,AI提取PDF内容,OCR,文本提取,兼容GPU和纯CPU,opendatalab开源
Diffree - AI一键P图、一键换衣,告别P图困扰,只需要输入一段文字就能轻松玩转P图的神器 本地一键整合包下载
如何搜索扫描件的文字?如何查找扫描件的内容?扫描件识别/OCR图像识别
腾讯开源PhotoMaker V2版,一张图,一键生成任何人、任何风格,高保真人像写真,无需训练lora模型 本地一键整合包下载
【Python自动化脚本】用Python实现OCR识别提取图片文字,操作简单新手小白也能学会,附源码!!!
audiocraft - 免费文本转音乐、AI音乐生成、AI音乐创作工具,Facebook开源,本地一键整合包下载
【什么是OCR?】强推!2024最容易上手的OCR文字识别教程分享!10小时带你全面解读OCR算法,详解OCR识别的优势!
Pyramid Flow V2版 - 8G显存玩的文本生成视频项目 快手联合北大、北邮开发的文生视频AI模型 支持384P@24fps 本地一键整合包下载
免费的AI一键视频翻译、配音工具,持一键视频翻译并配音 Linly-Dubbing本地一键整合包下载
使用FaceFusion一键创建AI数字虚拟人 - 附FaceFusion一键启动包
惊人创新!EchoMimic 让照片变出声视频,AI数字人视频一键生成,可用于AI数字人生成,EchoMimic 本地一键整合包下载
Video Background Remover - AI视频抠像、视频一键换背景软件 本地一键整合包下载
【Python自动化】教你用Python实现超精准识别图片中的文字(附源码)操作简单,小白也能轻松学会!
FunClip V2版 - AI全自动视频剪辑神器,阿里达摩院出品 本地一键整合包下载
easy wav2lip - 小白也能一键创建AI数字虚拟人,自媒体必备神器
AI一键音频转文字、音频转字幕工具,视频生成字幕、语音转文本,OpenAI开源语音识别神器Whisper本地一键整合包下载
AI一键换脸软件 FaceFusion3.0重磅升级,新增年龄修改、人脸编辑功能,全新架构,更强的人脸检测。
腾讯开源头像生成视频模型 V-Express,一张图片一键生成口播说话视频,音频驱动数字人项目 本地一键整合包下载
AudioSep:从音频中分离出特定声音(人声、笑声、噪音、乐器等)使用教程,及本地一键整合包下载
FireRedTTS V2版 - 小红书最新开源AI语音克隆合成系统 免训练一键语音克隆 本地一键整合包下载
2024最新超简单实现Python图片识别、颜色识别、文字识别Ocr教程
易语言Ocr识字找字,无需字库和训练模型,直接加载模块使用。
HelloMeme -一个实用人脸表情迁移模型,一张照片生成表情丰富的动图/视频 本地一键整合包下载
MaskGCT - 媲美真人的语音克隆大模型,零样本语音克隆,文本转语音大模型 本地一键整合包下载
F5-TTS V3版 - API版,新增api接口功能,上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载
AI一键智能制作生成证件照工具 - HivisionIDPhoto 本地一键整合包下载
MuseTalk - 一键创建高质量数字人(对口型)工具,附一键整合包
「Github一周热点46期」大模型OCR、IPTV直播源、工作流程自动化、下一代信息浏览器和下载金融数据工具
高精度AI直播实时换脸模型,让直播充满乐趣
ControlNet作者新作-Omost,让天下再也没有难写的提示词,小白也可以轻松学习AI绘画,一句话即可AI绘画,自动生成关键词,本地一键整合包
RoopUnleashed 4.1.1新版升级,新增子样本放大功能,人脸生成清晰度大幅度提升,本地一键整合包下载
AdvancedLivePortrait - 一张照片生成生动任意表情图片/视频,精准操控眼睛和嘴唇动作 表情包制作 本地一键整合包下载
🎉【免费开源】真的太不错拉,确实效果很赞,OCR-2.0:端到端模型,免费开源,统一模型,智能识别新体验!
一句话P图神器,打打字就能轻松P图。OmniGen 8Bit量化版,8G显存可玩,全能型图像生成模型,简单提示实现图像生成与精细编辑 本地一键整合包下载
大模型做 OCR? Llama OCR 和 Zerox 介绍
F5-TTS V4版,模型微调训练教程 - 接入千问大模型,支持实时语音克隆对话。上海交大最新零样本语音克隆,文本转语音 本地一键整合包下载