V
主页
大语言模型量化简介
发布人
https://www.ningxuefei.cc/talks/llm-efficiency-intro_tutorialonly.pdf
打开封面
下载高清视频
观看高清视频
视频下载器
[MLSys2024] FlashDecoding++: Faster Large Language Model Inference with Asynchro
大语言模型课程Lesson1-1 什么是大语言模型?
【tdxtrader】通达信连接QMT自动化下单(开源免费)
大模型量化技术知识祛魅~附合作招揽!
[ICML2024] Language Agents with Reinforcement Learning for Strategic Play in the
【量化论文速读】只用VWAP,年化收益43%,俩交易员写的论文,极简策略,小资金量。
如何部署一个属于自己的ChatGLM-4大语言模型--环境配置+模型微调+模型部署+效果展示,手把手教会你!
[ICLR2024] Skeleton-of-Thought: Prompting Large Language Models for Efficient Pa
不会编程也能玩的量化
大模型研讨课第一期(共10期)
NeurIPS'24预讲会|大语言模型12篇工作:多智能体协作、端到端信息检索、高效微调架构、不确定性感知规划等
用GPT-4.0训练小200万倍可直接本地运行的小模型
OpenWebUI+Ollama本地部署保姆级教程(非Docker),轻松搭建大语言模型!
神经网络加速器网站简介 (中文)
[ICML2024] Evaluating Quantized Large Language Models
6篇NeurIPS'24|大语言模型: 模拟人类信任行为、推理边界框架、偏见放大等
Fish-speech 1.4.2语音克隆工具,支持模型微调训练,API服务,文本生成语音,集成大语言模型语音聊天,本地一键部署整合包,解压即用
[FPGA2024] FlightLLM: Efficient Large Language Model Inference with a Complete M
开源AI女友安装教学 [Open-LLM-VTuber]
[NeurIPS 2024] Can LLMs Learn by Teaching for Better Reasoning? A Preliminary S
[NeurIPS24] DiTFastAttn: Attention Compression for Diffusion Transformer Models
【全374集】2024最新清华内部版!终于把AI大模型(LLM)讲清楚了!全程干货讲解,通俗易懂,拿走不谢!
【Grok-Beta 】马斯克为庆祝特朗普当选 宣布【几乎免费的大语言模型API】每月赠送25美金算力金 适用于最新发布的大语言模型Grok-Beta 快来注册
B站强推!绝对保姆级教程,同济大佬从零到一讲解【llama3】微调、量化、部署及应用,全程大白话讲解绝对通俗易懂!
《稀疏存内计算电脑与架构》-岳金山
[CVPR2024] FlashEval: Towards Fast and Accurate Evaluation of Text-to-image Diff
Python多因子量化选择全流程
大语言模型课程Lesson1-2 借助ChaGPT-Claude等大语言模型工具提高学习及工作效率
[ICLR2024] A Unified Sampling Framework for Solver Searching of Diffusion Probab
【墙裂推荐】25分钟搞定qwen大模型本地部署+微调法律大模型(只需5G内存)
【量化论文速读】300因子回测报告,帮你少走复现弯路。
AI智能体和大语言模型GPT-感知,学习,记忆,进化
第一个发现用github学大模型的人真的是天才!
小资金一个月能有这样的收益应该还算可以的吧!
免费的whisper模型与音视频翻译5-双语字幕快速生成
GPT o1模型使用及API调用
本地部署企业级大模型新姿势:智能体一体机
SMMR 多机协同探索
论文研读之“奶奶漏洞”为什么有效?:AI模型中的情绪刺激
全自动量化交易,通过Qmt实现,7*24小时自动运行