V
主页
【总览】5分钟了解多模态大模型在文档领域的研究现状
发布人
GPT4V之后,出现了大量的多模态视觉语言大模型工作,他们在文档,富文本上表现如何,5分钟了解现状
打开封面
下载高清视频
观看高清视频
视频下载器
多模态智能文档理解算法之LayoutLMv2
多模态智能文档理解模型串讲与实践经验分享
2024最热研究方向:知识图谱+大模型,基于GPT搭建医疗问答系统,原理详解+代码精讲,究极通俗易懂!
OCR Free文档理解模型Pix2Strict, OmniParser, ViTLP
可信文档理解与自动化率
【进军富文本】Vary & Vary-toy 年轻人的第一个视觉语言大模型
【全286集】价值4W的LLM大网课,字节大佬为萌新研制的大模型保姆级教程,大模型入门到进阶,一套全解决!
【更进一步】InstructBLIP: 指令微调让模型大大提升零样本学习能力
2024年吃透经典AI大模型面试题500问,7天学完,让你面试少走99%弯路!!大模型与深度学习算法面试指南。【存下吧,附80W字面试宝典】
OCR Free智能文档理解模型之SCOB
【AI Agent入门指南】7个AI Agent搭建实例,从入门到实战!手把手教你动手做AI Agent项目!
多模态大模型的幻觉类型和产生原因!大模型微调
【全108集】禁止AI自学走弯路!清华大佬耗费196小时录制的AI大模型教学,手把手教学,通俗易懂!0基础小白快速进阶AI大神!!
强烈推荐!大模型RAG企业项目实战:手把手带你搭建一套完整的RAG系统!rag增强检索/LLM大模型/大模型学习路线/微调/大模型入门
【Llama3.1】手把手教你使用gpt4all的方式在本机运行部署llama3.1(一),全程详解,保姆级教程
文字识别方法之ASTER
目标检测算法之Faster RCNN
全能大语言模型?视频、音频、图像、医学、雷达、热成像八项全能?OneLLM如何做到?太可怕了!
目标检测算法之CenterNet
文字检测算法之DBNet
多模态大模型幻觉成因解释以及基于惩罚回退策略的幻觉缓解方法
ChatGPT, GPT4V等生成式AI能替代算法岗做业务吗
开个新坑,打算尝试一下B站的新用法,当成视频博客
太厉害了 已跪!终于有人能把OpenCV图像处理讲的这么通俗易懂了,现在计算机视觉opencv全套分享给大家。
GraphRAG+阿里云通义千问大模型、百度文心千帆、智谱ChatGML等打造本地知识库,本地搜索、全局搜索二合一!#graphrag #rag #通义千问
吹爆!这可能是2024最新的PyTorch教程了,同济大佬12小时带你从入门到进阶,看完就对PyTorch全面了解!人工智能|深度学习|pytorch|机器学习
2024强推!终于有人把【时间序列预测模型】讲透彻了!LSTM、Informer、ARIMA模型、Pandas从零详解,迪哥半天带你搞定时间序列!
目标检测算法之RetinaNet
我竟然半天学会了六大深度神经网络:CNN、RNN、GAN、GNN、LSTM、Transformer,计算机博士一次带你吃透入门到实战!
创新驱动 科技引领未来
今天给大家推荐一本蛇尾书,大模型时代的启动手册!
轻松涨点,水论文必备:82个即插即用缝合模块,帮你快速搭建模型结构,轻松搞定大小论文!
Agent从入门到项目实战,从入门到精通,看这一个就够了!2024全网最强的Agent保姆级教程!
深度学习最热方向!今年最全的多模态大模型综述来啦!-神经网络/大模型/LLM
视觉大模型SAM2.0,分割一切!从环境配置到本地部署、推理
【人工智能】万字通俗讲解大语言模型内部运行原理, LLM /词向量/Transformer/注意力机制/前馈网络
中国信通院:99个LLM大模型应用落地案例集,针对大模型行业落地,大模型应用,私有化部署(附PDF)
【提示词工程】从零开始学Prompt Engineering(2024新手入门版)零基础入门教程!!!
Llama 3.1横空出世!开源巨无霸首次击溃闭源,全民GPT-4时代来临
8G 显存玩转书生大模型 Demo