V
主页
摩尔线程musa 转cuda代码 S80 BLAS FFT测试-结果出来了,很难接受
发布人
思来想去都不对,最终还是要面对事实。。。希望后续run time版本可以优化这些函数的表现吧,摩尔加油! cufft代码来自github:LeviBarnes cublas代码来自github:hma02 经过评论区摩尔大佬的亿番指点,在跑之前预跑了一次kernel的初始化,mublas提升不大;mufft提升比较大,达到p600的2倍算力,而且对大图片还有潜力,执行结果贴在下面供大家参考 mublas: float32: size 1024 average: 0.00231122 s, 928.702 GFLOPS float32: size 2048 average: 0.0195371 s, 879.131 GFLOPS float32: size 3072 average: 0.101815 s, 569.393 GFLOPS float32: size 4096 average: 0.448891 s, 306.137 GFLOPS float32: size 5120 average: 0.59389 s, 451.951 GFLOPS float32: size 6144 average: 1.18884 s, 390.145 GFLOPS float32: size 7168 average: 1.86621 s, 394.669 GFLOPS float32: size 8192 average: 5.82865 s, 188.628 GFLOPS float32: size 9216 average: 4.10432 s, 381.411 GFLOPS float32: size 10240 average: 5.96821 s, 359.803 GFLOPS mufft: Transform 256x256 image mufft exec time: 0.207755 ms. 0.300835 Mcells/ms. 24.0668 GFLOPS. Transform 512x512 image mufft exec time: 0.322869 ms. 0.774308 Mcells/ms. 69.6877 GFLOPS. Transform 768x768 image mufft exec time: 0.482679 ms. 1.16537 Mcells/ms. 111.7 GFLOPS. Transform 1024x1024 image mufft exec time: 0.579929 ms. 1.72435 Mcells/ms. 172.435 GFLOPS. Transform 1536x1536 image mufft exec time: 1.13722 ms. 1.97852 Mcells/ms. 209.425 GFLOPS.
打开封面
下载高清视频
观看高清视频
视频下载器
国产显卡摩尔线程又又又降了,那S80到底值不值得买?
【摩卡玩AI】Ubuntu + S80 = 摩笔马良本地绘图
国产显卡摩尔线程s80,玩永劫无间铂金三排成功吃鸡,游戏1080p全低只开垂直同步和抗锯齿实机真实录像。
国产显卡摩尔线程s80玩吃鸡!
摩尔线程 MTT S80 vs GTX 1060 vs GT 1030
好消息:龙芯3A6000兼容摩尔线程S80!坏消息,没开放驱动!
(也许是首发)国产显卡跑AI能行吗?(不敢说)准确的摩尔线程MTT S80 AI性能与N,I卡对比
【首发】摩尔线程 S80 运行 ComfyUI 基于 torch_musa (Stable Diffusion AI绘画)
摩尔线程S80实测,能打得过GTX1650吗?
[国产GPU]摩尔线程mtt s80基于torch_musa的vits demo不支持中文,但是感觉念起来好像挺好玩(bushi)
摩尔线程s80 Ubuntu系统本地部署ai图片生成速度。512*512的
摩尔线程S80国产显卡的新王者!4K全高玩死寂!
摩尔线程S80AI绘图教程-基于摩笔马良&Comfyui
摩尔线程完全开源复刻版AnimateAnyone
国产显卡摩尔线程MTT S80,AI实测8K全场景渲染动画效果,屌爆了
摩尔线程S80显卡硬件视频编码器MT_video_codec探索
过年看什么?摩尔线程musa库更新!望眼欲穿ubuntu新驱动!
899元的它,是一个合格的原神启动器吗?
1199的摩尔线程S80,体验完我有点失望
cuda代码变形记:cuda转码musa工具摩尔线程musify到底是个啥
摩尔线程S80 AIbox探秘-torch musa下的神经网络模型图片、文本分类
英伟达不允许模拟跑CUDA 国产GPU影响大吗?#小工蚁
摩尔线程到底是谁代工的?
抛下尬吹和偏见,国产显卡现在是什么水平?——摩尔线程 MTT S80详测
摩尔线程musa并行计算程序计时方法差异对比:musa_event还是C++原生chrono?
【教程&辟谣】摩尔线程非兼容平台点亮与辟谣AI绘画抵3080
摩尔线程S80:不推荐以使用为目的购买2024
美国对华禁售4090第二天,摩尔线程亮出新S90显卡,会解除4090吗?
摩尔线程S80 ubuntu 下 steam游戏测评,成功率75%还不错啊
打破NVIDIA护城河!AMD显卡可以原生跑CUDA应用:速度还挺快!
NVIDIA封杀转译兼容CUDA!摩尔线程官方回应
【GPU】国产显卡摩尔线程MTT S4000算力战平RTX4070,CUDA零成本转MUSA生产力平替
为什么消费者没有像支持华为一样支持摩尔线程
在摩尔线程S80上使用musa训练yolo模型和Lora模型,以及使用yolo模型进行机器识别。
CUDA编程基础入门系列(持续更新)
AMD显卡完美运行CUDA!原生运行并且不需要指令集!
摩尔线程S80 musa BLAS测试和双精度DGEMM测试但都失败了 TAT
【穷训】2W服务器训练7B模型
DDR5和LPDDR5都是HBM内存颗粒的淘汰物料
[WAIC2024]摩尔线程我来看你了