大型语言模型面对新知识表现如何?北大提出LLM测评新基准ALCUNA!
发布人