crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据
RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它主要功能是将中文自然语言转化为结构化数据。在使用时需要特定文件,如data/total_word_feature_extractor_zh.dat,该...
标签:Github项目crownpku/Rasa_NLU_Chi 中文自然语言处理 自然语言转换为结构化数据【Github】项目名:crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据
项目简介
RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它可以将中文自然语言转化为结构化数据,也就是实现中文自然语言理解。在使用时,需要有特定的文件如data/total_word_feature_extractor_zh.dat(由MITIE wordreptools从中文语料库训练得到,训练需要2 – 3天),同时要对中文语料库先进行标记化处理再用于训练,与用户案例最匹配的封闭域语料库效果最佳。此外,还可以从中文维基百科转储和百度百科下载训练好的模型。
项目使用
首先克隆项目并运行pythonsetup.py install进行安装。然后修改配置,对于中文目前有两种管道:一种是使用MITIE+Jieba(通过sample_configs/config_jieba_mitie.yml配置),另一种推荐使用MITIE+Jieba+sklearn(通过sample_configs/config_jieba_mitie_sklearn.yml配置)。还可以选择使用Jieba用户自定义字典或切换Jieba默认字典。训练模型时,如果在配置文件中指定项目名称,模型将保存在/models/your_project_name下,否则保存在/models/default下,通过python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml –data data/examples/rasa/demo – rasa_zh.json –path models命令进行训练。运行rasa_nlu服务器则使用python -m rasa_nlu.server – c sample_configs/config_jieba_mitie_sklearn.yml –path models命令。之后就可以在新终端通过curl从服务器获取结果。
项目总结
这个crownpku/Rasa_NLU_Chi项目为中文自然语言处理提供了很好的工具和方法,对于在该领域有需求的开发者有很大的帮助。欢迎大家留言讨论项目相关的内容,分享自己的使用经验或者遇到的问题等。
项目地址
数据统计
数据评估
本站链氪巴士提供的crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。