CLUE是一个中文语言理解测评基准项目,包含数据集、基准(预训练)模型、语料库和排行榜等重要部分。其数据集涵盖多种任务类型,如语义相似度、新闻分类、自然语言推理等,且具有不同的数据量和任务难度。预训练模型包含BERT、ALBERT、RoBERTa等常见技术,在不同数据集上有着不同的参数设置。项目还给出了各模型在不同任务上的实践结果,为中文自然语言处理提供了全面的参考,无论是模型开发还是应用开发都极具价值。