V
主页
[LLM && AIGC] visual chatgpt 01 认识 image captioning 及 blip model
发布人
本期code:https://github.com/chunhuizhang/bilibili_vlogs/blob/master/llm/tutorials/04_visual_chatgpt_01_image_caption.ipynb visual chatgpt:https://github.com/microsoft/visual-chatgpt flick8k:https://www.kaggle.com/datasets/kunalgupta2616/flickr-8k-images-with-captions 动手写 bert 系列:https://space.bilibili.com/59807853/channel/collectiondetail?sid=496538
打开封面
下载高清视频
观看高清视频
视频下载器
[LLM && AIGC] visual chatgpt 02 认识 Text2Image 及 stable-diffusion-v1-5
[personal chatgpt] trl 基础介绍:reward model,ppotrainer
【国内白嫖】11月17日最新ChatGPT4.0
【国内白嫖】11月15日最新ChatGPT4.0
【国内白嫖】10月30日最新ChatGPT4.0
[pytorch 强化学习] 01 认识环境(environment,gym.Env)以及 CartPole-v0/v1 环境
EMNLP2024分享会之多模态主题
[LLM+RL] 合成数据与model collapse,nature 正刊封面
[LLM && AIGC] 05 OpenAI 长文本(long text,超出 max_tokens)处理及 summary,划分 chunk 处理
[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader(mnist、fashionmnist、cifar10)
北大发布多模态大模型LLaVA-o1,推理计算Scaling新思路
[LLM & AIGC] 02 ChatGPT api 的简单介绍(system, user, assistant)与多轮对话
[LLMs 实践] 04 PEFT/LoRA 源码分析
OmniParser:微软发布截屏解析器, 可识别任何截屏中的可交互图标,理解屏幕中各个元素的含义,从而可准确地将预期动作与屏幕上的相应区域关联操作
[personal chatgpt] 从 RoPE 到 CoPE(绝对位置编码,相对位置编码,Contextual Position Encoding)
[LLM && AIGC] 06 OpenAI whisper 命令行及脚本的使用(生成视频的音频)
【国内白嫖】10月31日最新ChatGPT4.0随便用
[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程
【国内白嫖】11月16日最新ChatGPT4.0
【国内白嫖】10月31日最新ChatGPT4.0
逆天!免费用GPT-4o的网站,白嫖就是赚到!关键完全免费!
[personal chatgpt] trl reward model 与 RewardTrainer(奖励模型,分类模型)
(2024年)10项彻底改变未来世界的科技发明,其中排名第一的是世界最小的机器人,尽管它只有跳蚤大小,却能替代传统医疗设备进入人体进行复杂的手术。
深度学习+遥感,这口饭得趁热吃啊!绝佳A会创新点!!!
[pytorch distributed] 04 模型并行(model parallel)on ResNet50
1B多模态小模型只用于图片中表格的结构化提取,支持latex,markdown,html三种格式,效果似乎有点难说
【国内白嫖】11月19日最新ChatGPT4.0
【多模态论文解读】llama3.2-vision
英伟达发布MM-Embed:融合文本和图像的跨模态信息检索新模型
手撕llama32处理图片,喂饭级教程,全程敲写代码,吴恩达AI课程llama32多模态处理辅助,非常详细,适合新手学习
绝对通俗易懂!9小时精讲大模型预训练微调+四大多模态大模型CLIP BLIP VIT MLLM+对话机器人办公助手
多模态RAG #1:与包含图像的文档聊天 | 学习如何使用 CLIP model 构建多模式 RAG 系统
[调包侠] 04 使用预训练模型进行图像特征向量提取(image feature extractor,img2vec)并进行相似性计算
【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建(代码、数据共享)
[LLMs 实践] 03 LoRA fine-tune 大语言模型(peft、bloom 7b)
[pytorch distributed] 01 nn.DataParallel 数据并行初步
【国内白嫖】11月8日最新ChatGPT4.0
【国内白嫖】10月23日最新ChatGPT4.0随便用
[LLMs tuning] 01 trl SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion
[动手写神经网络] 手动实现 Transformer Encoder