crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据
RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它主要功能是将中文自然语言转化为结构化数据。在使用时需要特定文件,如data/total_word_feature_extractor_zh.dat,该...
标签:Github项目crownpku/Rasa_NLU_Chi 中文自然语言处理 自然语言转换为结构化数据【Github】项目名:crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据
项目简介
RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它可以将中文自然语言转化为结构化数据,也就是实现中文自然语言理解。在使用时,需要有特定的文件如data/total_word_feature_extractor_zh.dat(由MITIE wordreptools从中文语料库训练得到,训练需要2 – 3天),同时要对中文语料库先进行标记化处理再用于训练,与用户案例最匹配的封闭域语料库效果最佳。此外,还可以从中文维基百科转储和百度百科下载训练好的模型。
项目使用
首先克隆项目并运行pythonsetup.py install进行安装。然后修改配置,对于中文目前有两种管道:一种是使用MITIE+Jieba(通过sample_configs/config_jieba_mitie.yml配置),另一种推荐使用MITIE+Jieba+sklearn(通过sample_configs/config_jieba_mitie_sklearn.yml配置)。还可以选择使用Jieba用户自定义字典或切换Jieba默认字典。训练模型时,如果在配置文件中指定项目名称,模型将保存在/models/your_project_name下,否则保存在/models/default下,通过python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml –data data/examples/rasa/demo – rasa_zh.json –path models命令进行训练。运行rasa_nlu服务器则使用python -m rasa_nlu.server – c sample_configs/config_jieba_mitie_sklearn.yml –path models命令。之后就可以在新终端通过curl从服务器获取结果。
项目总结
这个crownpku/Rasa_NLU_Chi项目为中文自然语言处理提供了很好的工具和方法,对于在该领域有需求的开发者有很大的帮助。欢迎大家留言讨论项目相关的内容,分享自己的使用经验或者遇到的问题等。
项目地址
数据统计
数据评估
本站链氪巴士提供的crownpku/Rasa_NLU_Chi:将中文自然语言转换为结构化数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。
相关导航

Bluesky Social application is available on Web, iOS, and Android. It is a React Native app written in TypeScript with some Golang code. Part of the ATProtocol ecosystem, it has its own set of schemas and APIs. Contributions are accepted with specific rules. Security issues can be reported via email. It is an open - source project under the MIT license. This app offers an alternative in the social media landscape and has its own development and contribution guidelines.