AI论文分享，计算机视觉144篇，自然语言处理11篇，多模态19篇，语音处理17篇，时序预测6篇，机器人相关15篇 - 视频下载 Video Downloader

AI论文分享，计算机视觉144篇，自然语言处理11篇，多模态19篇，语音处理17篇，时序预测6篇，机器人相关15篇

发布人

-

打开封面下载高清视频观看高清视频视频下载器

鹏城实验室学者提出了一种新的视频语言多模态预训练模型SOTA-VLP，融合了空间时序建模方法，捕获细粒度特征，多项任务取得SOTA！

研一马上开学，还对论文期刊和影响因子一无所知，真的不怕老板请你去办公室喝茶嘛！？ -人工智能/深度学习/机器学习

还得看吴恩达！一口气讲透CNN、RNN、GAN、LSTM、YOLO、transformer等六大深度学习神经网路算法！真的不要太爽~（AI人工智能丨机器学习）

4.11最新AI论文分享，计算机视觉152篇，NLP12篇，多模态18篇，语音处理14篇，时序预测7篇，机器人13篇

OpenMV2024.2 版本正式发布 - 低成本、零代码助力深度学习落地千行百业

【全187集】字节跳动大佬终于把AI大模型（LLM）讲清楚了！通俗易懂，2024最新内部版！拿走不谢，学不会我退出IT圈！

一个神级代码复现网站，里面99%的论文都能找到！

支持语音，图像，文本，音乐等模态输入！上海AI Lab提出任意多模态语言模型AnyGPT！

文本引导的虚拟试衣来了，多模态在时尚领域的又一杀器！一键更换模特服装！目前代码模型已开源！

4.5日论文分享，计算机视觉111篇，NLP16篇，多模态16篇，语音处理4篇，时序预测3篇，机器人相关11篇

阿里发布最强中文图文多模态模型：Chinese CLIP，基于两亿中文图文多模态数据！

NLP学起来太难了吧！迪哥带你高效入门NLP自然语言处理，从原理到分类实战，3小时完全吃透！

【EMNLP2023】清华联合阿里提出了利用大型语言模型辅助多模态OOD检测的新方法！

人工智能医学影像处理实战：医疗大数据、影像组学、临床研究应用、SCI论文解读、Python数据处理、机器学习论文一口气学爽！

【全198集】CV入门到起飞！一口气学完Python、OpenCV、深度学习基础、Pytorch、卷积神经网络、物体检测、图像分割、等八大计算机视觉必备基础！

谷歌基于多模态预训练模型，提出了一种开放词汇的时序动作检测模型，可以检测视频中任意动作！性能远超之前方法！

今日论文分享，计算机视觉62篇，NLP7篇，多模态11篇，语音处理9篇，时序预测6篇，机器人相关6篇

原著作者李沐亲授！【动手学深度学习】入门必看！视频+PDF!真的通俗易懂！比刷剧还爽！（人工智能、机器学习、神经网络、机器学习算法）

【自动驾驶技术】花18000大价钱买的无人驾驶课程，从入门到提升的自动驾驶算法——感知实战、视觉定位、预测系统、路径规划、控制理论、强化学习

李飞飞团队最新开源ReKep：让机器人具备空间智能，还能整合GPT-4o！

动画讲解「Transformer」，一步一步深入浅出解释Transformer原理！这可能是我看到过最通俗易懂的Transformer教程了吧！-人工智能

Claude AI创始人Dario Amodei 大胆预测：下一代千亿参数AI模型智力将媲美诺奖得主，

MIT原班人马再出神作！KAN 2.0横空出世，剑指AI科学大一统！

腾讯优图提出啄木鸟（Woodpecker）：无需训练即可矫正多模态大语言模型的幻觉问题！

AI 新的图片数字人项目(loopy)

鹏城实验室开放了45页多模态预训练大模型综述！总结了近5年多模态预训练相关的算法和数据！多模态预训练学习包！

【纪录片】标新创异改变世界的想法 3 机器人【1080p】【双语特效字幕】【纪录片之家科技控】

图像分割领域怎么学才能快速出成果？迪哥梳理图像分割最佳学习路线，UNet/Deeplab/Mask2former/SAM图像分割算法全详解！

研一在读，代码完全不会，如何入门深度学习？

基于深度学习的视频文本的跨模态检索30页综述来了，包含近7年150篇相关论文！

简短书评：Java语言程序设计基础篇

CVPR2023 基于掩码的视觉和语言Transformer，能够同时完成以文生图和Image Captioning两种多模态生成任务，且效果非常不错！

MIT让神经网络一夜之间从黑盒变白盒，深度学习可解释新突破-50篇必读论文

【从零学习大模型】3小时掌握开源大模型本地部署到微调，从硬件指南到ChatGLM3-6B模型部署微调实战｜直达技术底层 prompt+RAG&Agent

杰出系友面对面|李沐讲座：大语言模型的实践经验和未来预测

多模态入门级学习路径整理，帮助你快速了解相关知识点#论文 #科研 #计算机 #ai #人工智能

大语言模型中RLHF的秘密，PPO算法的详解，相关代码已开源！！#科研 #论文 #ai #计算机 #NLP

华为诺亚实验室提出NLIP多模态模型：仅用2900万数据性能超过BLIP和CLIP等亿级数据训练的多模态模型！

2024最新 Android Studio 安装配置步骤

最强视觉backbone网络ConvNext v2来了！Meta AI融合了视觉掩码自监督框架，提出新的新的SOTA算法！目前代码和模型已开源！