V
主页
AI论文分享,计算机视觉144篇,自然语言处理11篇,多模态19篇,语音处理17篇,时序预测6篇,机器人相关15篇
发布人
-
打开封面
下载高清视频
观看高清视频
视频下载器
鹏城实验室学者提出了一种新的视频语言多模态预训练模型SOTA-VLP,融合了空间时序建模方法,捕获细粒度特征,多项任务取得SOTA!
研一马上开学,还对论文期刊和影响因子一无所知 ,真的不怕老板请你去办公室喝茶嘛!? -人工智能/深度学习/机器学习
还得看吴恩达!一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法!真的不要太爽~(AI人工智能丨机器学习)
4.11最新AI论文分享,计算机视觉152篇,NLP12篇,多模态18篇,语音处理14篇,时序预测7篇,机器人13篇
OpenMV2024.2 版本正式发布 - 低成本、零代码 助力深度学习落地千行百业
【全187集】字节跳动大佬终于把AI大模型(LLM)讲清楚了!通俗易懂,2024最新内部版!拿走不谢,学不会我退出IT圈!
一个神级代码复现网站,里面99%的论文都能找到!
支持语音,图像,文本,音乐等模态输入!上海AI Lab提出任意多模态语言模型AnyGPT!
文本引导的虚拟试衣来了,多模态在时尚领域的又一杀器!一键更换模特服装!目前代码模型已开源!
4.5日论文分享,计算机视觉111篇,NLP16篇,多模态16篇,语音处理4篇,时序预测3篇,机器人相关11篇
阿里发布最强中文图文多模态模型:Chinese CLIP,基于两亿中文图文多模态数据!
NLP学起来太难了吧!迪哥带你高效入门NLP自然语言处理,从原理到分类实战,3小时完全吃透!
【EMNLP2023】清华联合阿里提出了利用大型语言模型辅助多模态OOD检测的新方法!
人工智能医学影像处理实战:医疗大数据、影像组学、临床研究应用、SCI论文解读、Python数据处理、机器学习论文一口气学爽!
【全198集】CV入门到起飞!一口气学完Python、OpenCV、深度学习基础、Pytorch、卷积神经网络、物体检测、图像分割、等八大计算机视觉必备基础!
谷歌基于多模态预训练模型,提出了一种开放词汇的时序动作检测模型,可以检测视频中任意动作!性能远超之前方法!
今日论文分享,计算机视觉62篇,NLP7篇,多模态11篇,语音处理9篇,时序预测6篇,机器人相关6篇
原著作者李沐亲授!【动手学深度学习】入门必看!视频+PDF!真的通俗易懂!比刷剧还爽!(人工智能、机器学习、神经网络、机器学习算法)
【自动驾驶技术】花18000大价钱买的无人驾驶课程,从入门到提升的自动驾驶算法——感知实战、视觉定位、预测系统、路径规划、控制理论、强化学习
李飞飞团队最新开源ReKep:让机器人具备空间智能,还能整合GPT-4o!
动画讲解「Transformer」,一步一步深入浅出解释Transformer原理!这可能是我看到过最通俗易懂的Transformer教程了吧!-人工智能
Claude AI创始人Dario Amodei 大胆预测:下一代千亿参数AI模型智力将媲美诺奖得主,
MIT原班人马再出神作!KAN 2.0横空出世,剑指AI科学大一统!
腾讯优图提出啄木鸟(Woodpecker):无需训练即可矫正多模态大语言模型的幻觉问题!
AI 新的图片数字人项目(loopy)
鹏城实验室开放了45页多模态预训练大模型综述!总结了近5年多模态预训练相关的算法和数据!多模态预训练学习包!
【纪录片】标新创异 改变世界的想法 3 机器人【1080p】【双语特效字幕】【纪录片之家科技控】
图像分割领域怎么学才能快速出成果?迪哥梳理图像分割最佳学习路线,UNet/Deeplab/Mask2former/SAM图像分割算法全详解!
研一在读,代码完全不会,如何入门深度学习?
基于深度学习的视频文本的跨模态检索30页综述来了,包含近7年150篇相关论文!
简短书评:Java语言程序设计 基础篇
CVPR2023 基于掩码的视觉和语言Transformer,能够同时完成以文生图和Image Captioning两种多模态生成任务,且效果非常不错!
MIT让神经网络一夜之间从黑盒变白盒,深度学习可解释新突破-50篇必读论文
【从零学习大模型】3小时掌握开源大模型本地部署到微调,从硬件指南到ChatGLM3-6B模型部署微调实战|直达技术底层 prompt+RAG&Agent
杰出系友面对面|李沐讲座:大语言模型的实践经验和未来预测
多模态入门级学习路径整理,帮助你快速了解相关知识点#论文 #科研 #计算机 #ai #人工智能
大语言模型中RLHF的秘密,PPO算法的详解,相关代码已开源!!#科研 #论文 #ai #计算机 #NLP
华为诺亚实验室提出NLIP多模态模型:仅用2900万数据性能超过BLIP和CLIP等亿级数据训练的多模态模型!
2024最新 Android Studio 安装配置步骤
最强视觉backbone网络ConvNext v2来了!Meta AI融合了视觉掩码自监督框架,提出新的新的SOTA算法!目前代码和模型已开源!