V
主页
Triton优化GPTQ算法GPU内核 效率提升3~6倍
发布人
Triton优化GPTQ算法GPU内核效率提升3~6倍
打开封面
下载高清视频
观看高清视频
视频下载器
《vLLM: 简单、高效、易用的大模型推理框架》
《基于摩尔线程全功能GPU的Triton编译器实现》
《如何使用 Triton 写性能超越 Pytorch 的 Softmax 算子》
《规约类算子的 triton kernel 优化模式》
用GPTQ算法量化大型模型 大幅减少GPU使用并提高准确率
如何提高垂直领域RAG准确率? #小工蚁
【Triton编程】Dropout,Matrix Multiplication,Layer Normalization
《如何开发一个高效的融合 MoE 算子》
导师推荐!周志华《机器学习》+李航《统计学习方法》!两大人工智能必读经典书籍180讲带你彻底学透!从入门到成神!附两大电子版书籍!——深度学习、机器学习算法
这可能是最完整的【计算机视觉-三维重建】算法教程了吧!真的通俗易懂!建议收藏!——(人工智能、深度学习、机器学习实战、机器学习算法、Pytorch)
算子优化MoE模型推理加速4倍
PyTorch原生优化Llama2推理加速,性能提升近10倍 #小工蚁
比刷剧更爽!【llama3本地部署】这绝对是B站把llama3本地部署讲的最清楚的教程了吧!真的通俗易懂!(人工智能、深度学习、机器学习算法、图像处理)
大模型推理性能优化策略 #小工蚁
用LLM从文本中自动提取数据 生成表格的新算法效率提升110倍
DSPy提示工程自动优化框架 #小工蚁
强化学习底层原理讲解!AI学习如何上下楼梯(深度强化学习)!真的通俗易懂!建议收藏!——(人工智能、深度学习、机器学习算法、神经网络、计算机视觉)
AWQ大模型量化INT4比FP16 推理快2倍,GPU内存1/3
2024最新!【机器学习算法】不愧是浙江大学教授胡浩基主讲,一次性就将机器学习算法讲透彻了!(支持向量机、神经网络、图像处理、神经网络、AI、计算机视觉)
计算机视觉!【人脸检测项目实战】一口气带你学完:人脸识别、疲劳检测、口罩检测、活体检测、属性识别!真的通俗易懂!(人工智能、深度学习、神经网络、AI)
原著作者:李沐带你读《动手学深度学习》真的通俗易懂!大佬亲授全方面解读“花书”,带你从入门到精通!(人工智能、深度学习、机器学习、神经网络、图像处理、AI)
介绍GPU最新内核优化GEMM原理 #小工蚁
RLHF人类反馈强化学习局限性和RAFT高效对齐算法
比刷剧还爽!【OpenCV+YOLO】终于有人能把OpenCV图像处理+YOLO目标检测讲的这么通俗易懂了!J建议收藏!(人工智能、深度学习、机器学习算法)
RankRAG英伟达检索增强生成算法 #小工蚁 多个测试数据集准确率SoTA
目标检测领域必学算法:YOLOV1~V11目标检测算法原理/部署/源码/应用全详解!半天搞定YOLO算法全家桶!(深度学习/计算机视觉)
多模态大模型在网易音乐推荐的应用 #小工蚁
云计算环境中使用GPU 开源Kubernetes解决方案
仿人脑海马体HippoRAG智能问答准确度提升 20% #小工蚁
【视频+教材】原著大佬李沐带你读《动手学习深度学习》真的通俗易懂!深度学习入门必看!(人工智能、机器学习、神经网络、计算机视觉、图像处理、AI)
吃透多模态四大模型!计算机大佬带你一口气学会:CLIP BLIP VIT MLLM多模态底层逻辑!真的通俗易懂!带你真正的对话机器人!(人工智能、深度学习)
谷歌发现RAG缩放定律 释放LLM长上下文潜力 提升RAG准确率 #小工蚁
PyTorch2.0正式发布 下一代开源人工智能算法平台
最值得一看的机器学习算法!集成算法、决策树算法、聚类算法、线性回归、神经网络算法、词向量word2vec、!真的通俗易懂!(人工智能、深度学习、机器学习算法)
开源项目vLLM V1版本 预计12月发布,有啥优化?
书生200亿开源大模型压力测试 算法优化后性能飙升几十倍 #小工蚁 #开源大模型
太强了!【GNN+Transformer】2024年最容易研究论文方向的内容!论文精讲+代码复现!小白都能轻松看懂!建议收藏!(图神经网络、机器学习、AI)
强推!这可能是最详细的【智慧交通】项目实战教程!真的通俗易懂!——(多目标跟踪、卡尔曼滤波、匈牙利算法、车流量统计、机器学习、神经网络)
计算机视觉-目标检测算法!这可能是最值得一看的目标检测算法入门教程了吧!真的通俗易懂!(Fast R-CNN、Mask R-CNN、YOLO、 SSD)
大模型微调训练实践 准确度10%提升至90%