V
主页
多模态智能文档理解算法之LayoutLMv2
发布人
视频博客,请大家批判性地观看,如果有错误非常感谢大家的指正~ 本系列详细讲解了智能文档理解领域的基础,LayoutLMv2模型代码和训练相关代码,Transformer代码 李沐大神讲Transformer视频链接 BV1pu411o7BE Transformer博客链接 https://zhuanlan.zhihu.com/p/420820453 PPT链接:链接:https://pan.baidu.com/s/1FemU3dGKqpCKnTzttAeojQ 提取码:wi49 hugging face datasets教程链接: https://blog.csdn.net/qq_42388742/article/details/114293746 https://huggingface.co/docs/datasets/dataset_script
打开封面
下载高清视频
观看高清视频
视频下载器
多模态智能文档理解模型串讲与实践经验分享
多模态智能文档理解算法之LayoutLMv3
多模态智能文档理解模型之LiLT
OCR Free文档理解模型Pix2Strict, OmniParser, ViTLP
Bi_direct_adapter(通用双向适配器)-来自AAAI2024!适用于多模态领域
OCR Free智能文档理解模型之Donut
面壁 MiniCPM-V 2.6:最强开源端侧多模态 LLM
讲座08 | 面向多模态大模型的具身智能平台LEGENT——清华大学THUNLP lab在读博士胡锦毅
多模态高清解码原理
微软Phi3.5系列模型分析、微调、部署-Phi-3.5-vision-instruct、Phi-3.5-MoE-instruct、Phi-3.5-mini
OCR Free智能文档理解模型之SCOB
【多模态+大模型+知识图谱】2024完整版:这绝对是B站最全的教程,论文创新点终于解决了!——人工智能/深度学习/aigc/计算机视觉
Meta AI助手 视觉识别测试(Quest3 V68)
斯坦福大学AI博士,揭秘最新多模态AI - 杨俊睿 Jackie,MAUI
可信文档理解与自动化率
多模态大模型 MiniCPM-V 2.6「实时视频理解」首次上端!
【多模态+知识图谱】半天居然就跟着博士从零构建知识图谱!基于知识图谱的六大项目实战!医药问答系统、知识抽取、推荐系统、Neo4j数据库、大模型
时间序列预测 | Autoformer 简介
多模态大模型幻觉成因解释以及基于惩罚回退策略的幻觉缓解方法
【初次尝试】5分钟快速了解多模态大模型LLAVA & LLAVAR
【多模态+大模型+知识图谱】2024最好创新的研究方向!绝对是B站最全的教程,论文创新点终于解决了!——人工智能|深度学习|aigc|计算机视觉
目标检测算法之Faster RCNN
我居然只花一小时就学懂了如何通过重编程LLM进行时间序列预测!论文解读,附原文+代码!!!(llm大模型/跨模态交互/时序预测/人工智能)
华为昇腾究竟落后在哪?
我敢说学习【NLP自然语言处理】只要看这个就够了,NLP中最重要的核心内容,不愧是大家一致仍可的教程-人工智能/机器学习/深度学习
文字检测算法之DBNet
最火的多模态大语言模型,都是套路?详解六种最火套路!
【B站首推】大模型RAG企业级项目实战:手把手带你搭建一套属于你的RAG系统,原理讲解+代码解析,超级详细,LLM_大模型_多模态_Agent_RAG
如何最快速写一篇论文?手把手教你!多模态无人机检测
大模型RAG企业项目实战:手把手带你搭建一套完整的RAG系统,原理讲解+代码解析,草履虫都能学明白!LLM大模型_RAG_大模型微调_多模态
企业级实战!基于LangChain实现RAG检索增强,原理讲解+代码解析,草履虫都能看懂!LLM大模型_RAG_大模型微调_多模态
InternVL1.5多模态大模型
【面壁学术沙龙】第5期:多模态大模型 偏好对齐
一小时深度解析【Sora分析】视频生成模型,如何做到文本生成视频?详解背后的技术原理与应用案例!!!
如何设计和使用多模态评估任务来评估学习者的语言能力
国内智驾老兵百度开源BEVWorld:通过统一BEV潜在空间实现自动驾驶的多模态世界模型
2024 AI夏令营 第二期|【从零入门AI竞赛(多模态方向)】进阶分享
大模型的困境:两年热度未催生爆款应用
膜拜大佬!2024最新的多模态模型CLIP教程,半小时讲明白CLIP模型的原理以及底层逻辑,看完就能全面了解神器CLIP!人工智能|深度学习|计算机视觉|NLP
【通往AGI值得探索的方向:具身智能】北大董豪精讲具身智能关键技术研究:操纵、决策、导航!多模态大模型、机器人