Github项目

candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库

此项目收集了多种用于训练中英文对话系统的语料,包括中文电影对白、短消息、ChatterBot聊天语料、自然语言处理相关数据集、小黄鸡语料、白鹭时代问答语料、开源的聊天语料库以及...

标签:

【Github】项目名:candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库

项目简介

这一项目收集了从网络获取的用于训练中文(英文)聊天机器人的对话语料。其中包含多种公开语料,如中文电影对白语料(dgk_shooter_min.conv.zip)但噪音大且问答关系对应不佳;包含中文和英文短消息的TheNUSSMSCorpus;ChatterBot中文基本聊天语料;自然语言处理相关的英文数据集(DatasetsforNaturalLanguageProcessing);小黄鸡语料(已分词xiaohuangji50w_fenciA.conv.zip和未分词xiaohuangji50w_nofenci.conv.zip);白鹭时代中文问答语料;来自各种开源的Chatcorpusrepository;保险行业QA语料库等,还有部分未公开语料。

项目总结

这个项目为训练中英文对话系统提供了丰富的语料资源,无论是对聊天机器人开发者还是研究自然语言处理的人员都有一定的价值。希望大家能积极留言讨论这个语料库相关的话题,例如如何更好地利用这些语料等。

项目地址

GitHub链接直达

数据统计

数据评估

candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库浏览人数已经达到14,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库特别声明

本站链氪巴士提供的candlewill/Dialog_Corpus:用于训练中英文对话系统的语料库都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...