crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据

文章目录

【Github】项目名：crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据

项目简介

RasaNLU for Chinese是从RasaHQ/rasa_nlu派生出来的项目。它可以将中文自然语言转化为结构化数据，也就是实现中文自然语言理解。在使用时，需要有特定的文件如data/total_word_feature_extractor_zh.dat（由MITIE wordreptools从中文语料库训练得到，训练需要2 – 3天），同时要对中文语料库先进行标记化处理再用于训练，与用户案例最匹配的封闭域语料库效果最佳。此外，还可以从中文维基百科转储和百度百科下载训练好的模型。

项目使用

首先克隆项目并运行pythonsetup.py install进行安装。然后修改配置，对于中文目前有两种管道：一种是使用MITIE+Jieba（通过sample_configs/config_jieba_mitie.yml配置），另一种推荐使用MITIE+Jieba+sklearn（通过sample_configs/config_jieba_mitie_sklearn.yml配置）。还可以选择使用Jieba用户自定义字典或切换Jieba默认字典。训练模型时，如果在配置文件中指定项目名称，模型将保存在/models/your_project_name下，否则保存在/models/default下，通过python -m rasa_nlu.train -c sample_configs/config_jieba_mitie_sklearn.yml –data data/examples/rasa/demo – rasa_zh.json –path models命令进行训练。运行rasa_nlu服务器则使用python -m rasa_nlu.server – c sample_configs/config_jieba_mitie_sklearn.yml –path models命令。之后就可以在新终端通过curl从服务器获取结果。

项目总结

这个crownpku/Rasa_NLU_Chi项目为中文自然语言处理提供了很好的工具和方法，对于在该领域有需求的开发者有很大的帮助。欢迎大家留言讨论项目相关的内容，分享自己的使用经验或者遇到的问题等。

项目地址

GitHub链接直达

数据统计

数据评估

crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据浏览人数已经达到116，如你需要查询该站的相关权重信息，可以点击"5118数据""爱站数据""Chinaz数据"进入；以目前的网站数据参考，建议大家请以爱站数据为准，更多网站价值评估因素如：crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据的访问速度、搜索引擎收录以及索引量、用户体验等；当然要评估一个站的价值，最主要还是需要根据您自身的需求以及需要，一些确切的数据则需要找crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据的站长进行洽谈提供。如该站的IP、PV、跳出率等！

特别声明

本站链氪巴士提供的crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据都来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由链氪巴士实际控制，在2024年12月6日上午12:00收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，链氪巴士不承担任何责任。

链氪巴士致力于优质、实用的网络站点资源收集与分享！本文地址https://linkedbus.com/sites/21604.html转载请注明

相关导航

ymcui/Chinese-BERT-wwm：基于全词掩码的中文BERT预训练模型

ymcui/Chinese - BERT - wwm项目发布基于全词掩码技术的中文预训练模型及其相关模型。项目详细给出各模型参数、数据来源、下载方式等。并在多类中文数据集（如阅读理解、情感分析等）测试不同模型效果，为中文自然语言处理研究提供模型资源与实验数据参考。

liuhuanyong/liuhuanyong.github.io-面向中文自然语言处理的学习资源

liuhuanyong/liuhuanyong.github.io是一个丰富的面向中文自然语言处理的学习资源。它包含了六十余类实践项目及学习索引，像语言资源构建、社会计算、自然语言处理组件等多个学习主题都有涵盖。并且还包含作者的个人简介、学习心得等内容，还有语言资源以及工业落地系统等方面的内容。这是一个专门为自然语言处理入门学习者打造的较为全面的学习资源，能够让学习者在这个平台上获取多方面的知识，对中文自然语言处理领域有一个较为全面的初步认识，方便学习者在这个基础上进一步深入学习该领域的知识。

InsaneLife/ChineseNLPCorpus：中文自然语言处理数据集

InsaneLife/ChineseNLPCorpus是一个综合性的中文自然语言处理数据集项目。它包含多种类型的数据集，像阅读理解数据集有DuReader等不同种类；任务型对话数据集包括MedicalDS等；文本分类、情感分析、实体识别等方面也有诸多相关数据集。这些数据为做相关实验提供了丰富的材料，并且项目欢迎补充提交合并。任何人对这个项目有想法或者有使用经验都可以参与讨论。

vue-cli3.0后台管理模板：基于vue3.0构建后台管理模板

这是一个基于vue3.0实现的后台管理模板。开发者运用自己所学的vue知识从0开始搭建，会不定期更新内容并实现常用功能，如登录注册、数据增删改查等。使用vue最新脚手架搭建环境、编写界面，用axios请求接口、渲染界面，数据部分存储到easy - mock数据中。还具备Element - ui、请求拦截和响应拦截、富文本编辑器等多种功能，项目编译和运行也有明确步骤。

Bluesky Social App: Decentralized Social Media App for Multiple Platforms

Bluesky Social application is available on Web, iOS, and Android. It is a React Native app written in TypeScript with some Golang code. Part of the ATProtocol ecosystem, it has its own set of schemas and APIs. Contributions are accepted with specific rules. Security issues can be reported via email. It is an open - source project under the MIT license. This app offers an alternative in the social media landscape and has its own development and contribution guidelines.

【GitHub】wuhan2020项目全面解析

“wuhan2020”项目是为应对武汉特殊情况而生，整合资源信息。本文介绍其背景、目的、技术、案例、优劣势，它在抗疫中有重要作用但也有局限，欢迎大家讨论。

暂无评论

暂无评论...

crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据

猜你喜欢

【Github】项目名：crownpku/Rasa_NLU_Chi：将中文自然语言转换为结构化数据

项目简介

项目使用

项目总结

项目地址

数据统计

数据评估

相关导航

暂无评论

猜你喜欢

科技快讯

猜你喜欢