brightmart/roberta_zh：RoBERTa中文预训练模型

文章目录

【Github】项目名：brightmart/roberta_zh：RoBERTa中文预训练模型

一、项目简介

本项目是用TensorFlow实现了在大规模中文上RoBERTa的预训练，也会提供PyTorch的预训练模型和加载方式。RoBERTa是BERT的改进版，通过改进训练任务和数据生成方式、训练更久、使用更大批次、使用更多数据等获得了较好的效果，可以用Bert直接加载。项目包含不同层数（如6层、12层、24层）的RoBERTa模型，训练数据涵盖新闻、社区问答、多个百科数据等，规模从10G到30G不等。同时还给出了在多个任务（如互联网新闻情感分析、自然语言推断、问题匹配语任务、阅读理解等）上与其他模型（如BERT、Bert – wwm – ext、XLNet等）的效果对比。

二、核心技术

1. 数据生成与改进：取消下一个句子预测，并且数据连续从一个文档中获得。使用30G中文训练数据，包含3亿个句子，100亿个字（token），具有多样性。
2. 训练策略：总共训练近20万次，见过近16亿个训练数据实例；在CloudTPUv3 – 256上训练24小时，相当于在TPUv3 – 8（128G显存）上训练一个月；使用8k的批次batchsize；调整优化器等超参数。
3. 全词mask（whole word mask）：如果一个完整的词的部分WordPiece子词被mask，则同属该词的其他部分也会被mask，本项目未直接实现dynamic mask，但通过复制训练样本得到多份数据，每份数据使用不同mask并加大复制份数间接得到dynamic mask效果。

三、项目总结

该项目为RoBERTa在中文环境下的预训练提供了全面的方案，包括模型的实现、不同版本的发布、在多种任务上的性能测试以及与其他模型的对比等。希望对自然语言处理领域的研究者和开发者有所帮助。欢迎大家留言分享自己的使用经验或者提出相关问题，一起参与到这个项目的讨论中来。

项目地址

GitHub链接直达

数据统计

数据评估

brightmart/roberta_zh：RoBERTa中文预训练模型浏览人数已经达到122，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：brightmart/roberta_zh：RoBERTa中文预训练模型的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找brightmart/roberta_zh：RoBERTa中文预训练模型的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站链氪巴士提供的brightmart/roberta_zh：RoBERTa中文预训练模型都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由链氪巴士实际控制，在2024年12月6日上午12:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，链氪巴士不承担任何责任。

链氪巴士致力于优质、实用的网络站点资源收集与分享！本文地址https://linkedbus.com/sites/21576.html转载请注明

相关导航

PrimeAIM-AI驱动的瞄准辅助工具

PrimeAIM是一个AI驱动的瞄准辅助工具。它运用opencv - python包进行屏幕捕捉，PyTorch结合YOLOv5检测对象或玩家，用Python编写以避过反作弊检测并通过Windows API控制鼠标移动来瞄准。具有多种功能如瞄准部位选择、速度调整等，在现代高性能GPU上表现佳，仅用于教育目的，使用有风险。

NLP-LOVE/ML-NLP：机器学习、深度学习、NLP面试知识与代码实现

NLP - LOVE/ML - NLP项目主要包含机器学习、深度学习、NLP面试常考知识点和代码实现，以各个模块构建清晰知识体系，每章问题是面试可能问到的知识点，结尾有算法实战代码案例，项目持续更新且欢迎大家加入完善，是算法工程师理论基础学习和面试复习的实用资源。

mathAI：拍照做题程序识别数学计算式及结果

mathAI是一个半开源的拍照做题程序，输入含数学计算题的图片能输出计算式与结果。目前上传版本处理简单一维算术表达式，参考相关论文可处理复杂表达式。项目用Python实现，包含图像预处理、字符识别等多流程，采用OpenCV、TensorFlow等技术，有优点也有不足，期待大家一起讨论改进等相关话题。

HanLP：面向生产环境的多语种自然语言处理工具包

HanLP是一个开源的自然语言处理工具包，基于PyTorch和TensorFlow2.x双引擎构建，具备功能完善、精度准确、性能高效、语料时新、架构清晰、可自定义的特点。支持130种语言上的多种任务，预训练众多模型且持续迭代。提供两种API，适用于不同场景，还有多种应用案例，如在特定语料库上训练模型等，是自然语言处理领域的实用工具。

chenyuntc/pytorch-book：PyTorch入门与实战教程资源库

chenyuntc/pytorch - book是《深度学习框架PyTorch：入门与实践（第2版）》对应的代码库，可独立作为PyTorch入门教程。它包含基本使用、高级扩展、实战应用三大模块，基本使用部分涵盖PyTorch主要模块和常用工具介绍，高级扩展涉及向量化思想、分布式操作、CUDA扩展等，实战应用实现了动漫头像生成、自动写诗等有趣应用，提供完整代码和预训练模型，是一个很有价值的PyTorch学习资源库。

Chinese-Text-Classification-Pytorch：基于pytorch的中文文本分类项目

Chinese-Text-Classification-Pytorch是一个基于pytorch的中文文本分类项目。它涵盖了TextCNN、TextRNN等多种模型。项目使用从THUCNews抽取的20万条新闻标题作为数据集，共10个类别。预训练词向量采用搜狗新闻Word+Character300d，提供了不同模型的训练、测试使用说明，并且给出了各模型的效果对比，对于中文文本分类研究和开发具有重要的参考价值。

暂无评论

暂无评论...

brightmart/roberta_zh：RoBERTa中文预训练模型

猜你喜欢

【Github】项目名：brightmart/roberta_zh：RoBERTa中文预训练模型

一、项目简介

二、核心技术

三、项目总结

项目地址

数据统计

数据评估

相关导航

暂无评论

猜你喜欢

科技快讯

猜你喜欢