此项目收集了多种用于训练中英文对话系统的语料,包括中文电影对白、短消息、ChatterBot聊天语料、自然语言处理相关数据集、小黄鸡语料、白鹭时代问答语料、开源的聊天语料库以及保险行业QA语料库等,其中部分语料存在一些问题如噪音大等情况,但整体为聊天机器人开发和自然语言处理研究提供了丰富资源。