V
主页
PK 周杰伦,全能音乐创作大模型 SongComposer 作词作曲令人惊叹
发布人
【分享人】 丁双睿 ,香港中文大学 MMLab 组一年级博士生,研究方向包括大语言模型和视频理解等。曾有多篇工作发表在 CVPR、ICCV 等顶会,长期担任计算机视觉和机器学习顶会审稿人。 【分享内容】 - 前大语言模型时代的音乐生成 - 大语言模型如何高效地学习歌曲生成 - 未来音乐模型的展望 【相关资料】 paper: https://arxiv.org/abs/2402.17645 homepage: https://pjlab-songcomposer.github.io/ 【InternLM 】公众号回复‘开放麦’即可获取视频课件,微信添加小助手 InternLM 进入导师群沟通
打开封面
下载高清视频
观看高清视频
视频下载器
运用 SAM 模型分割任意点云
多模态大模型的技术实践与思考
多模态任务终结者:Meta-Transformer
基于 Visual Transformer 的分割模型综述
MindSearch:AI 时代的“思考型”智能搜索引擎
ACL 24 论文分享(东北大学信息检索小组场)
最接近《银翼杀手》增强功能的AI算法?DiffBIR:统一的盲人脸修复和盲图像超分 SOTA 框架
AI实战营第二期 开营仪式
迈向更强的端到端多人姿态估计
数据集采集与标注、LabelBee工具介绍
PapersWithCode 榜首 | AI 动画生成框架 AnimateDiff 开源,更丝滑的动画制作体验,附在线应用教程
AI实战营 结营仪式
8G 显存玩转书生大模型 Demo
在家作AI,昨天780,一台电脑,操作简单,分享我的接单平台,接单技巧和资源分享,目前经济自由!!
AI 生成视频不闪了!社区大佬又整新活啦!
模型部署与 MMDeploy 实践
CVPR23 | 3D Occupancy 预测冠军方案:FB-OCC
探索未知:LLM Agent 应用开发的全新时代
目标检测与MMDetection
正式开源,免费商用 | “书生·浦语灵笔”图文混合创作大模型
社区开放麦#15| 突破纯视觉 3D 检测深度估计瓶颈
Beyond Segmentation Anything,超越SAM
【MMTracking】单目标跟踪!持续跟踪!
用AI写文章必看!一条指令彻底去除AI味!轻松写出爆款!【全网独家】深层解析AI底层原理!
剪到一半给自己气笑了
马斯克放大招「Grok2」秒杀ChatGPT|免费用❗️
语音与音频生成 Amphion揭秘霉霉如何演唱《稻香》
医学大模型研发与应用的最新进展
1. PyTorch 模型部署基础知识
3 图像分类代码实战与超算平台介绍
弱监督有向目标检测 | 杨学
ai永远无法替代ai
社区开放麦#30 | 入门剪枝利器 MMRazor,迈出模型压缩第一步
MM 小海象带你玩有趣的AI应用1:MagicMaker:轻触分割、生成创意,用 AI 的魔力改造你的图片
OpenCompass 大模型评测实战
RTMPose 家族史诗级更新!多人、全身一网打尽
10次面试9个offer,AI 时代找工作的新思路
MMClassification 实践 2
业界可用的高性能的姿态估计模型能有多快? | 社区开放麦#46
【整整108集】顶级大佬196小时讲完的Midjourney教程(AI绘画)全程干货无废话!小白入门到精通!这还学不会,我退出绘画圈!