[LLM && AIGC] visual chatgpt 01 认识 image captioning 及 blip model - 视频下载 Video Downloader

[LLM && AIGC] visual chatgpt 01 认识 image captioning 及 blip model

发布人

本期code：https://github.com/chunhuizhang/bilibili_vlogs/blob/master/llm/tutorials/04_visual_chatgpt_01_image_caption.ipynb

visual chatgpt：https://github.com/microsoft/visual-chatgpt

flick8k：https://www.kaggle.com/datasets/kunalgupta2616/flickr-8k-images-with-captions

动手写 bert 系列：https://space.bilibili.com/59807853/channel/collectiondetail?sid=496538

打开封面下载高清视频观看高清视频视频下载器

[LLM && AIGC] visual chatgpt 02 认识 Text2Image 及 stable-diffusion-v1-5

[personal chatgpt] trl 基础介绍：reward model，ppotrainer

【国内白嫖】11月17日最新ChatGPT4.0

【国内白嫖】11月15日最新ChatGPT4.0

【国内白嫖】10月30日最新ChatGPT4.0

[pytorch 强化学习] 01 认识环境（environment，gym.Env）以及 CartPole-v0/v1 环境

EMNLP2024分享会之多模态主题

[LLM+RL] 合成数据与model collapse，nature 正刊封面

[LLM && AIGC] 05 OpenAI 长文本（long text，超出 max_tokens）处理及 summary，划分 chunk 处理

[动手写神经网络] 01 认识 pytorch 中的 dataset、dataloader（mnist、fashionmnist、cifar10）

北大发布多模态大模型LLaVA-o1，推理计算Scaling新思路

[LLM & AIGC] 02 ChatGPT api 的简单介绍（system, user, assistant）与多轮对话

[LLMs 实践] 04 PEFT/LoRA 源码分析

OmniParser：微软发布截屏解析器，可识别任何截屏中的可交互图标，理解屏幕中各个元素的含义，从而可准确地将预期动作与屏幕上的相应区域关联操作

[personal chatgpt] 从 RoPE 到 CoPE（绝对位置编码，相对位置编码，Contextual Position Encoding）

[LLM && AIGC] 06 OpenAI whisper 命令行及脚本的使用（生成视频的音频）

【国内白嫖】10月31日最新ChatGPT4.0随便用

[LLMs 实践] 01 llama、alpaca、vicuna 整体介绍及 llama 推理过程

【国内白嫖】11月16日最新ChatGPT4.0

【国内白嫖】10月31日最新ChatGPT4.0

逆天！免费用GPT-4o的网站，白嫖就是赚到！关键完全免费！

[personal chatgpt] trl reward model 与 RewardTrainer（奖励模型，分类模型）

(2024年)10项彻底改变未来世界的科技发明，其中排名第一的是世界最小的机器人，尽管它只有跳蚤大小，却能替代传统医疗设备进入人体进行复杂的手术。

深度学习+遥感，这口饭得趁热吃啊！绝佳A会创新点！！！

[pytorch distributed] 04 模型并行（model parallel）on ResNet50

1B多模态小模型只用于图片中表格的结构化提取，支持latex，markdown，html三种格式，效果似乎有点难说

【国内白嫖】11月19日最新ChatGPT4.0

【多模态论文解读】llama3.2-vision

英伟达发布MM-Embed：融合文本和图像的跨模态信息检索新模型

手撕llama32处理图片，喂饭级教程，全程敲写代码，吴恩达AI课程llama32多模态处理辅助，非常详细，适合新手学习

绝对通俗易懂！9小时精讲大模型预训练微调+四大多模态大模型CLIP BLIP VIT MLLM+对话机器人办公助手

多模态RAG #1：与包含图像的文档聊天 | 学习如何使用 CLIP model 构建多模式 RAG 系统

[调包侠] 04 使用预训练模型进行图像特征向量提取（image feature extractor，img2vec）并进行相似性计算

【深度学习环境搭建】01 本机、GPU服务器端深度学习环境搭建（代码、数据共享）

[LLMs 实践] 03 LoRA fine-tune 大语言模型（peft、bloom 7b）

[pytorch distributed] 01 nn.DataParallel 数据并行初步

【国内白嫖】11月8日最新ChatGPT4.0

【国内白嫖】10月23日最新ChatGPT4.0随便用

[LLMs tuning] 01 trl SFTTrainer 中的 formatting_func 与 DataCollatorForCompletion

[动手写神经网络] 手动实现 Transformer Encoder