V
主页
揭秘NVIDIA大模型库FasterTransformer(二), 每日一个C++/AI知识点
发布人
-
打开封面
下载高清视频
观看高清视频
视频下载器
揭秘NVIDIA大模型加速库FasterTransformer(三),每日一个C++/AI知识点
揭秘NVIDIA大模型加速库FasterTransformer(四), 每日一个C++/AI知识点
AI运行时性能优化神器之LRUcache替换算法--每日一个C++/AI知识点
全网首篇探究GPU内CUDAcore和TensorCore并行计算
【设计模式专场】揭秘C++模板工厂模式
深入解析大模型kimi背后的推理系统解决了什么问题
AI推理优化视角解读LLaMA模型结构和源代码
自研的AI工程和CUDA课程全新上线v2.0版本
为什么有了const又来个constexpr?到底啥区别?每天一个C++/AI知识点
玩转C++排序和累计算法之每日一个C++/AI知识点
C++工厂模式之每日一个C++/AI知识点(又要送书咯
NV FT解读之大模型smooth quantization, 省GPU必备
记上周秋招面试一小伙的全过程- AI HPC/AI推理优化方向
【设计模式】C++面试高频之单例模式、懒汉模式和饿汉模式
【大模型论文解读】Flash decoding++:有些“槽点”的LLM推理优化paper
总结常出没在C++项目的std::tuple--每日一个C++/AI知识点
一起赏析百度Paddle kernelCall源码的C++模板"炫技"show
[C++与深度学习框架] 模板推导再炫技: 统一各个芯片device各个算子的调用和分发机制
【vLLM】个人视角畅谈大模型推理优化的挑战、现有工作和未来展望
【TensorRT MoE】全网首篇从TensorRT-LLM CUDA MoE kernel角度理解Mixtral 8x7B的推理加速和展望
大模型量化技术知识祛魅~附合作招揽!
【C++】你真的了解C++ memcpy吗?来看看它的性能分析
大模型能无限长输出?streamingLLM告诉你答案
面试撕leetcode环节的C++STL常用用法总结 (上篇)
【直播回放】AI-HPC公司名称篇+应届生时间线安排-2024年4月6日场
【C++与大模型】模板技法实现任意类型下的LLM大模型推理
应届生个人技能怎么写?半句话差距有多大!
观高通裁员,2023年了外企还值得去吗
【设计模式专场】揭秘C++面试高频之迭代器模式
天塌了,应届生的出路断了,25年国企必须推行末位退出制度,铁饭碗要碎了?
【直播回放】AI-HPC岗位名称篇和公司篇-2024年3月24日场(下篇)
深入解读tensorRT-LLM的关键技术(未完待续)
大模型LLM生成策略:搜索or采样?(搜索篇)
24届毕业生大厂工作三个月后,吐槽实习和工作最大的区别居然是…好好珍惜在校园中无忧无虑的日子、校园就像一个避风港。
25届自驾算法工程师,三段自驾实习,多个30k+offer,为何还要跑路?
好工作是不会在网上流通的
表面说你傻,背后悄悄把路铺好啦
大学生找工作的两点建议
高效学习两步走 少问“为什么”
本科应届生校招入银行,虽然进来不容易,但进来之后不疯也很难啊。银行笔试从陪跑变主角,全靠它|银行笔试备考