V
主页
京东 11.11 红包
个性化语音合成开源模型的技术解析及应用
发布人
【本期分享嘉宾】 达摩院语音实验室算法专家 周进 【关于AI模型社】 阿里达摩院扫地僧《AI模型社》直播栏目,每周三/四晚20点定期分享AI业界够干货、够前沿,最有趣、最有料的优质开源AI模型,并邀请主创团队亲临直播间,分享核心技术、设计思路,还有团队招聘信息不定期掉落噢
打开封面
下载高清视频
观看高清视频
视频下载器
F5-TTS语音模型,零样本声音克隆,情绪复刻,文字转语音,TTS,E2-tts,SWivid开源,支持N卡和纯CPU
封神榜模型上新 :揭秘姜子牙通用大模型
开源啦!赛博华佗项目开源,一键搭建本地多模态大模型,搭建属于你的健康小管家,帮助促进医疗资源平衡
MaxKB:高级编排
工业级语音识别:Paraformer开源模型技术解析
探访KnowLM团队:基于大模型探索知识图谱抽取新边界
【知识幻觉 上】看完这个视频,我终于明白AI为什么会胡言乱语了
一文讲清楚CUDA
OpenAI开源了?多智能体框架Swarm重磅发布|Swarm快速入门介绍|Swarm调用流程及使用性能介绍
AI也能画漫画?工业级轻量AI人像漫画开源模型技术解析
【中英精校】2024.10.17 | 英伟达发布最新开源大模型 | 超越GPT-4o和3.5 Sonnet
【开源铺路,AI自由】为了让AI成为优等生,我们做了什么?
解析 OpenAI Swarm 最懂 AI 的一群人设计的 Agent 框架|录屏精简版
【知识幻觉 下】如何制造一个永不出错的AI?
【技术Vol.4】看清楚了!"子弹时间"搬进冬奥,1min如何完成特效挑战?
1B多模态小模型只用于图片中表格的结构化提取,支持latex,markdown,html三种格式,效果似乎有点难说
听声辨人:准确识别说话者 3D-Speaker说话人智能识别技术分享
【开源项目】F5-TTS 一句话克隆声音,开源TTS,附赠Windows整合包,有兴趣的可以玩玩0.0
腾讯一口气开源了两个大模型!我可以实现数字分身和真人手办自由了
【科技X动漫】EVA与可塑性记忆中的AI解析
2024.10.16 | Aria -- 比 GPT-4o 更好, 新的开源 AI 震惊业界!| Aria 是 Rhymes AI 开发的一种新的开源 AI
Chat凉宫春日:打造30个IP人物的中文聊天语言模型
上线即开源!国产AI,终于也能说人话了?
Gello+Lerobot自定义ALOHA主从遥操臂
AI生成的真人版《名侦探柯南》,东宝你就照着抄作业吧
【2021阿里云峰会开发者大会】贾扬清:深度学习框架一年一变?直击AI开发最大痛点!
关于我只用两个月就结合AI发了SCI1区论文——经验分享和本人案例
为什么AI常常出洋相?顶会专家一语道破“普通人对AI的最大误解”
Meta AI 推出 CoTracker3:实现丝滑的像素级目标追踪
【顶会论文】自动驾驶面对的道路情况有多复杂?如何高效仿真?
Adobe 2024 一年一度黑科技大会来袭!
当万物都需要辨别真假,AI带来的还是便利吗?!
【青橙学者】白蕊:29岁发6篇Science,她说:“正因为它是世界难题,我们才要去做!”
30分钟联审10案?把法官思维装到AI里需要几步?
2024.10.27 | 本周热门开源 GitHub 项目 #4 | 从 AI 图像生成和浏览器自动化,到将文档转换为播客,再到让 AI 控制您的计算机
还得是敏神出手!IC Light V2即将开源,Flux商用生态第一个重磅炸弹到来
聊法条,拍电影,看病炒股写论文:AI竟然能做这么多事?【扫地僧的云栖大会vlog】
8年设计师,聊聊AI是怎么把我“取代”的:创意工作者如何面对AI浪潮?经历分享与职业建议 | ProArt创艺国度校园行分享记录
【科技X影视】超越现实的神预言,0202重看黑客帝国