Github项目

crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据

RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它主要功能是将中文自然语言转化为结构化数据。在使用时需要特定文件,如data/total_word_feature_extractor_zh.dat,该...

标签:

【Github】项目名:crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据

项目简介

RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它可以将中文自然语言转化为结构化数据,也就是实现中文自然语言理解。在使用时,需要有特定的文件如data/total_word_feature_extractor_zh.dat(由MITIE wordreptools从中文语料库训练得到,训练需要2 – 3天),同时要对中文语料库先进行标记化处理再用于训练,与用户案例最匹配的封闭域语料库效果最佳。此外,还可以从中文维基百科转储和百度百科下载训练好的模型。

项目使用

首先克隆项目并运行pythonsetup.py install进行安装。然后修改配置,对于中文目前有两种管道:一种是使用MITIE+Jieba(通过sample_configs/config_jieba_mitie.yml配置),另一种推荐使用MITIE+Jieba+sklearn(通过sample_configs/config_jieba_mitie_sklearn.yml配置)。还可以选择使用Jieba用户自定义字典或切换Jieba默认字典。训练模型时,如果在配置文件中指定项目名称,模型将保存在/models/your_project_name下,否则保存在/models/default下,通过python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml –data data/examples/rasa/demo – rasa_zh.json –path models命令进行训练。运行rasa_nlu服务器则使用python -m rasa_nlu.server – c sample_configs/config_jieba_mitie_sklearn.yml –path models命令。之后就可以在新终端通过curl从服务器获取结果。

项目总结

这个crownpku/Rasa_NLU_Chi项目为中文自然语言处理提供了很好的工具和方法,对于在该领域有需求的开发者有很大的帮助。欢迎大家留言讨论项目相关的内容,分享自己的使用经验或者遇到的问题等。

项目地址

GitHub链接直达

数据统计

数据评估

crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据浏览人数已经达到18,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据特别声明

本站链氪巴士提供的crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...