ymcui/Chinese-XLNet：中文XLNet预训练模型

文章目录

【Github】项目名：ymcui/Chinese – XLNet：中文XLNet预训练模型

项目简介

本项目由哈工大讯飞联合实验室的崔一鸣等人提供了面向中文的XLNet预训练模型。其目的在于丰富中文自然语言处理资源，提供多元化的中文预训练模型选择。该项目基于CMU/谷歌官方的XLNet，还提及了诸多相关模型成果及发布情况等信息。

模型相关细节

模型下载

提供了XLNet – mid（24 – layer, 768 – hidden, 12 – heads, 209Mparameters）和XLNet – base（12 – layer, 768 – hidden, 12 – heads, 117Mparameters）的下载，包括Google下载和百度网盘下载方式，同时给出了不同版本（如TensorFlow、PyTorch）下的操作方式，以及针对中国大陆境内和境外用户的下载建议等。

基线系统效果

在简体中文阅读理解（CMRC2018）、繁体中文阅读理解（DRCD）、情感分类（ChnSentiCorp）等任务上，对比了中文BERT、BERT – wwm、BERT – wwm – ext以及XLNet – base、XLNet – mid等模型的效果，给出了不同模型在开发集、测试集等不同数据集上的评测指标结果。

预训练细节

以XLNet – mid模型为例，包括生成词表（按照XLNet官方教程步骤，使用SentencePiece生成大小为32000的词表）、生成tf_records以及预训练（因计算设备受限，相比XLNet – base仅增加层数，其余参数未变动）等过程及相关命令。

下游任务微调细节

下游任务微调使用谷歌CloudTPUv2（64GHBM）设备，针对CMRC2018、DRCD、ChnSentiCorp等不同任务分别给出了脚本参数示例，包括输入文件路径、模型路径、训练相关参数（如batch_size、learning_rate等）等内容。

项目总结

本项目为中文自然语言处理提供了预训练模型资源，具有丰富的模型细节和实验数据。希望广大用户能够从中受益，如果大家有任何想法或者建议，欢迎在评论区留言讨论。

项目地址

GitHub链接直达

数据统计

数据评估

ymcui/Chinese-XLNet：中文XLNet预训练模型浏览人数已经达到127，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：ymcui/Chinese-XLNet：中文XLNet预训练模型的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找ymcui/Chinese-XLNet：中文XLNet预训练模型的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站链氪巴士提供的ymcui/Chinese-XLNet：中文XLNet预训练模型都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由链氪巴士实际控制，在2024年12月6日上午12:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，链氪巴士不承担任何责任。

链氪巴士致力于优质、实用的网络站点资源收集与分享！本文地址https://linkedbus.com/sites/21596.html转载请注明

相关导航

chatopera/Synonyms：中文近义词相关的工具包

Synonyms是一个专注于中文近义词相关的工具包，可用于自然语言理解的众多任务，如文本对齐、推荐算法、相似度计算等。其词表容量为435,729，采用word2vec进行词向量训练。可应用于企业OA智能问答、HR智能问答等场景中的聊天机器人或智能问答系统。这个工具包能进行句子相似度比较、关键词提取等操作，对自然语言处理有着重要意义。

斯坦福CS224n自然语言处理中文笔记：深度学习课程笔记资源。

这是一个关于斯坦福CS224n深度学习自然语言处理课程2019年的中文笔记项目。遵循CCBY - NC - SA4.0协议，欢迎任何人参与完善。项目中有笔记整理活动正在进行，并且给出了多种参与项目的联系方式，包括在github上提issue、发邮件以及在学习交流群中联系群主或管理员等，是一个很好的自然语言处理课程学习资源。

ymcui/Chinese-BERT-wwm：基于全词掩码的中文BERT预训练模型

ymcui/Chinese - BERT - wwm项目发布基于全词掩码技术的中文预训练模型及其相关模型。项目详细给出各模型参数、数据来源、下载方式等。并在多类中文数据集（如阅读理解、情感分析等）测试不同模型效果，为中文自然语言处理研究提供模型资源与实验数据参考。

jieba：结巴中文分词组件：功能强大的Python中文分词工具

jieba是一个优秀的Python中文分词组件。它支持精确、全、搜索引擎、paddle等多种分词模式，可满足不同需求。还具备词性标注、自定义词典、关键词提取等功能，并且基于高效的算法实现。在多种自然语言处理任务中有广泛应用，同时有多种其他语言的实现版本，适合开发人员在不同场景下进行中文文本处理。

funNLP：几乎最全的中文NLP资源库

funNLP是一个极为全面的自然语言处理资源库，涵盖了从数据抽取、词库、文本生成与摘要、语言检测到知识图谱等多方面的内容。其中包含众多实用的工具，如中英文敏感词处理、各种数据的抽取、多种词库等，还拥有大量不同类型的NLP数据集，像百度中文问答数据集、中文聊天语料等，无论是对NLP的基础研究还是实际应用开发都有很大价值。

brightmart/albert_zh：海量中文预训练ALBERT模型

brightmart/albert_zh是一个基于TensorFlow实现的ALiteBertForSelf - SupervisedLearningLanguageRepresentations项目。提供多种版本的中文ALBERT预训练模型，包括不同参数规模和性能特点的模型。项目涵盖预训练、下游任务微调的代码示例，还有如转换为TensorflowLite格式进行移动端部署的操作及性能测试等内容。详细展示了ALBERT模型对BERT的改进之处，如词嵌入向量参数因式分解、跨层参数共享、段落连续性任务等改进方式。这对于自然语言处理研究和应用开发有很大的参考价值。

暂无评论

暂无评论...

ymcui/Chinese-XLNet：中文XLNet预训练模型

猜你喜欢

【Github】项目名：ymcui/Chinese – XLNet：中文XLNet预训练模型

项目简介

模型相关细节

模型下载

基线系统效果

预训练细节

下游任务微调细节

项目总结

项目地址

数据统计

数据评估

相关导航

暂无评论

猜你喜欢

科技快讯

猜你喜欢