V
主页
揭秘Sora底层模型架构(DiT) Diffusion Models with Transformers
发布人
揭秘Sora底层模型架构(DiT) Diffusion Models with Transformers
打开封面
下载高清视频
观看高清视频
视频下载器
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
GPT-4模型架构泄露:1.8万亿参数 混合专家模型 (MoE) 揭秘
虚拟试衣使用Diffusion模型,Sora未来应用场景 #小工蚁
矢量数据库对比和选择指南
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache?
ClickHouse和Elastisearch 深度对比
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构
目前最强本地【视频生成】CogVideo工具一个视频讲明白参数与工作流及模型下载 文生视频 图生视频 运镜控制
纯Memba架构大语言模型开源性能超越Transformer #小工蚁 #memba
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
智源公开大模型SFT训练数据集微调后性能达到和超过GPT4
谷歌开源gemma2大语言模型用了啥新技术?
中美AI视频模型对比,看看Runway AI与国内某文生视频AI哪个更强大?第29回合
大模型量化技术概述
零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁
Jamba1.5开源大模型同等性能降低10倍KV Cache
通义千问千亿模型比720亿模型更省算力 #小工蚁
OpenAI Sora多模态模型实现AI理解和模拟真实世界的能力 #小工蚁 #openai #sora
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁
谷歌医疗大模型登Nature,中英文医疗模型差距有多少?
微软论文逆向工程Sora大模型 #小工蚁
Stable Diffusion 3开源发布 文生图大模型媲美闭源商业模型
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁
Text2SQL Llama 7B模型微调DuckDB-NSQL-7B #小工蚁
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁
百川2大模型是如何炼成的? #小工蚁 #百川2
Qwen2-Audio语音多模态大模型使用实践 #小工蚁
LoRA是什么你了解吗? 优化Stable Diffusion的微调
多模态Embedding开源模型 Visualized BGE #小工蚁
复旦开源MOSS预训练模型 130亿参数,可商用
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7%
Sora,打脸吗?中国的AI视频大模型都火到海外了
NL2SQL大模型生成SQL调研报告
RAGChecker开源RAG诊断框架
将LLaMA3上下文长度从8K扩展 到超过100万
Transformers支持3种量化算法性能对比 #小工蚁
使用RTX4090+GaLore算法 全参微调Yi-6B大模型
制造业在大模型应用如何实现降本增效 #小工蚁
Clickhouse和Snowflake深度比较,商业成功、技术架构、性能和生态