等变性为何能提高数据效率? 等变VS非等变Transformer 到底如何正确选择?
发布人