为什么现在的LLM都是Decoder only的架构呢?
发布人