V
主页
自编教材分享:第八章—访存优化(四)
发布人
访存优化是为了平衡成本、保持存储容量以及访问速度,现代计算机存储系统一般采用多级存储结构,从功能上,每一层存储器可以视作下一层存储器的缓存,在多级缓存作用下存储系统有明显的性能提升,本系列视频分享围绕存储系统将从上至下探讨相关优化,以及利用数据布局改善程序存储性能。本次分享介绍减少内存读写、数据对齐、直接内存访问、访存与计算重叠等内存优化。
打开封面
下载高清视频
观看高清视频
视频下载器
自编教材分享:第八章—访存优化(六)
自编教材分享:第八章—访存优化(一)
循环优化(六):循环分段
自编教材分享:第八章—访存优化(三)
自编教材分享:第五章—编译与运行优化
论文分享:计算图优化Welder
自编教材分享:第八章—访存优化(五)
自编教材分享:第九章—负载均衡优化
自编教材分享:第四章—系统配置优化(二)
自编教材分享:第六章—程序编写优化(一)
Astitch:机器学习访存密集计算编译优化框架
自编教材分享:第九章—OpenMP编程简介
自编教材分享:第四章—系统配置优化(一)
自编教材分享:第一章—程序性能优化的意义(二)
自编教材分享:第十章—CUDA程序优化(一)
自编教材分享:第二章—程序性能的度量指标及优化流程(一)
自编教材分享:第十章—CUDA程序优化(二)
自编教材分享:第一章—程序性能优化的意义(一)
循环优化(五):循环不变量外提
自编教材分享:第六章—程序编写优化(三)
循环优化(九):循环倾斜
自编教材实操课程分享:第九章—数据填充避免伪共享
自编教材分享:第三章—程序性能的分析和测量(一)
自编教材分享:第十一章—MPI程序简介
循环优化(八):循环分裂
自编教材分享:第六章—程序编写优化(二)
自编教材分享:第九章—避免隐式同步
自编教材分享:第七章—数据级并行(一)
自编教材分享:第七章—指令级并行(二)
自编教材分享:第十一章—数据划分优化
循环优化(二):循环合并
自编教材实操课程分享:第六章—典型数据结构的性能分析
自编教材分享:第七章—指令级并行(一)
自编教材分享:第六章—程序编写优化(五)
自编教材实操课程分享:第六章—全局变量优化
循环优化(一):循环展开和压紧
ANSOR 优化算子代码解读(一)
自编教材实操课程分享:第八章—结构体拆分
深度学习框架发展(二)
自编教材分享:第九章—向量化指导命令