【博士Vlog】大语言模型只需要1.58bit?人人都能训练大模型了!极限模型压缩效果反而更好?怎么做到的?
发布人