GPT2-chitchat：基于GPT2的中文闲聊机器人

文章目录

【Github】项目名：GPT2 – chitchat：基于GPT2的中文闲聊机器人

项目简介

本项目是基于GPT2的中文闲聊机器人，模型实现基于HuggingFace的transformers。代码中给出了许多详细的中文注释，方便大家更好地理解代码。该项目受GPT2 – Chinese的启发，在生成阶段，使用了Temperature、Top – kSampling和NucleusSampling等。此项目被微软的DialoGPT项目引用（为了简化生成方法，删除了MMI的生成方法）。

项目结构

1. 数据相关：
– data/train.txt：默认的原始训练集文件，存放闲聊语料。
– train.pkl：对原始训练语料进行tokenize之后的文件，存储一个list对象，list的每条数据表示一个多轮对话，即一条训练数据。
2. 模型相关：
– model：存放对话生成的模型，如epoch40（经过40轮训练之后得到的模型）、config.json（模型参数的配置文件）、pytorch_model.bin（模型文件）。
3. 字典文件：
– vocab/vocab.txt：字典文件。默认的字典大小为13317，若需要使用自定义字典，需要将confog.json文件中的vocab_size字段设为相应的大小。
4. 代码文件：
– sample：存放人机闲聊生成的历史聊天记录。
– train.py：训练代码。
– interact.py：人机交互代码。
– preprocess.py：数据预处理代码。

使用方法

快速开始

– 在模型分享中下载模型，将模型文件夹model_epoch40_50w放到model目录下，执行如下命令进行对话：
– python interact.py –no_cuda –model_path model_epoch40_50w（使用cpu生成，速度相对较慢）。
– 或python interact.py –model_path model_epoch40_50w –device 0（指定0号GPU进行生成，速度相对较快）。
2.

数据预处理

– 在项目根目录下创建data文件夹，将原始训练语料命名为train.txt，存放在该目录下。train.txt的格式为每段闲聊之间间隔一行。运行preprocess.py，对data/train.txt对话语料进行tokenize，然后进行序列化保存到data/train.pkl。
3.

训练模型

– 运行train.py，使用预处理后的数据，对模型进行自回归训练，模型保存在根目录下的model文件夹中。可以通过指定patience参数进行earlystop。
4.

人机交互

– 运行interact.py，使用训练好的模型，进行人机交互，输入Ctrl+Z结束对话之后，聊天记录将保存到sample目录下的sample.txt文件中。执行interact.py时，可以尝试通过调整topk、topp、repetition_penalty、max_history_len等参数，调整生成的效果。如果要使用GPU进行生成，则不要调用–no_cuda参数，并且通过–device gpu_id来指定使用哪块GPU。

项目总结

这个GPT2 – chitchat项目为中文闲聊提供了一个基于GPT2的解决方案，从数据预处理、模型训练到人机交互都有相应的方法和代码实现。欢迎大家在评论区留言讨论这个项目的使用心得或者提出改进的建议。

项目地址

GitHub链接直达

数据统计

数据评估

GPT2-chitchat：基于GPT2的中文闲聊机器人浏览人数已经达到196，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：GPT2-chitchat：基于GPT2的中文闲聊机器人的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找GPT2-chitchat：基于GPT2的中文闲聊机器人的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站链氪巴士提供的GPT2-chitchat：基于GPT2的中文闲聊机器人都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由链氪巴士实际控制，在2024年12月6日上午12:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，链氪巴士不承担任何责任。

链氪巴士致力于优质、实用的网络站点资源收集与分享！本文地址https://linkedbus.com/sites/21618.html转载请注明

相关导航

xitu/gold-miner：掘金翻译计划英译中技术社区

掘金翻译计划是一个专注于将优质互联网技术文章从英文翻译为中文的社区。文章来源为掘金上的英文分享文章，内容涵盖区块链、人工智能等多领域以及官方文档手册等。目前已完成4000多篇文章和13个官方文档手册的翻译，1500多名译者参与其中，读者为热爱新技术的开发者。

【GitHub】Layui开源项目介绍：简单易用的前端UI框架

Layui是一款简单易用的前端UI框架，具有组件丰富、轻量级等优点，适合后端人员和初学者。本文介绍其项目背景、目的、核心技术等，也分析了优势与局限，欢迎留言讨论。

yanhaijing/vertical-center-水平垂直居中方案汇总

yanhaijing/vertical - center项目专注于水平垂直居中这一前端布局常见问题。它提供了多种元素定宽高和不定宽高的居中方案，像absolute+负margin等和absolute+transform等。同时还详细分析各方案在PC端和移动端的兼容性情况，并给出不同场景下的推荐方案，这对于前端开发者选择合适的水平垂直居中方案具有重要意义。

MobX-Docs-CN-MobX中文文档

MobX-Docs-CN是与MobX官网文档同步更新的中文文档，目前已更新到MobX5版本，同时提供旧版文档的查看方式。它的存在为国内MobX爱好者构建了一个良好的学习环境，众多的贡献者参与到文档的完善工作中，大家可以共同努力让这个文档变得更好，以满足国内开发者对MobX知识的需求。

airAnime：轻量的聚合番剧搜索工具

airAnime是一款轻量的聚合番剧搜索工具。它的核心代码不依赖前端构建工具，部署时需要特定的操作。部分数据源基于后端的抓取脚本，可手动部署或部署到Vercel平台。开发者因为找番剧太耗时而创建该项目，它经历了多个版本的发展，现在的v3版本希望能给用户带来更好的体验，欢迎大家使用并留言讨论。

easy-monitor：企业级Node.js应用性能监控与线上故障定位解决方案

Easy - Monitor 3.0是全新的企业级Node.js应用性能监控与线上故障定位解决方案。它支持多平台，具备如Node.js进程与系统指标性能监控、错误日志展示、Npm模块安全风险提示等功能。其控制台前端基于Vue.js+iViewUI框架编写，服务端基于Egg.js框架编写。旨在帮助Node.js开发者应对性能和稳定性挑战，欢迎加入钉钉群讨论使用中遇到的问题。

暂无评论

暂无评论...

GPT2-chitchat：基于GPT2的中文闲聊机器人

猜你喜欢

【Github】项目名：GPT2 – chitchat：基于GPT2的中文闲聊机器人

项目简介

项目结构

使用方法

快速开始

数据预处理

训练模型

人机交互

项目总结

项目地址

数据统计

数据评估

相关导航

暂无评论

猜你喜欢

科技快讯

猜你喜欢