pkuseg - python是一个多领域中文分词工具包,基于特定论文开发。它具有多领域分词特性,支持如新闻、网络、医药等领域。与其他分词工具包相比,使用相同数据时它有更高的准确率。它支持用户自训练模型,还可进行词性标注。安装上有多种方式且有相应的注意事项,使用方式涵盖默认配置分词、细领域分词、词性标注分词和文件分词等,适用于多种需求场景。
Jiagu是一个深度学习自然语言处理工具,使用大规模语料训练而成。它能提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感分析、文本聚类等功能。安装方式有pip安装和源码安装,使用方式多样,可用于多种自然语言处理任务,如分词、词性标注、命名实体识别等,不同功能都有对应的示例代码可供参考。