ymcui/Chinese - BERT - wwm项目发布基于全词掩码技术的中文预训练模型及其相关模型。项目详细给出各模型参数、数据来源、下载方式等。并在多类中文数据集(如阅读理解、情感分析等)测试不同模型效果,为中文自然语言处理研究提供模型资源与实验数据参考。
ymcui/Chinese - XLNet项目由哈工大讯飞联合实验室推出,提供了面向中文的XLNet预训练模型,包含模型下载相关信息,如不同参数的XLNet - mid和XLNet - base模型在Google和百度网盘的下载方式等,且在多个任务如简体中文阅读理解、繁体中文阅读理解、情感分类任务上对比了多种模型的基线系统效果,还详细阐述了预训练细节以及下游任务微调细节等内容,是一个对中文自然语言处理研究有重要参考价值的项目。