中文分词

站内搜索

站内搜索

pyhanlp是HanLP1.x的Python接口，支持自动下载与升级，兼容Python<=3.8。内部算法经考验且有配套书籍。功能包括中文分词、句法分析等，如hanlp segment用于分词，hanlp parse用于句法分析，还有服务器启动、升级操作等功能，对自然语言处理相关操作十分实用。

241 0

HanLP1.xpyhanlpPython接口中文分词

ownthink/Jiagu：深度学习自然语言处理工具

Jiagu是一个深度学习自然语言处理工具，使用大规模语料训练而成。它能提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感分析、文本聚类等功能。安装方式有pip安装和源码安装，使用方式多样，可用于多种自然语言处理任务，如分词、词性标注、命名实体识别等，不同功能都有对应的示例代码可供参考。

234 0

Jiaguownthink中文分词关键词抽取

yanyiwu/gojieba：”结巴”中文分词的Golang版本

GoJieba是"结巴"中文分词的Golang版本。支持多种分词方式如最大概率模式、HMM新词发现模式等。核心算法底层由C++实现性能高效，字典路径可配置，NewJieba和NewExtractor可变形参。还有详细的用法示例展示其在不同场景下的应用，包括全模式、精确模式、搜索引擎模式下的分词，新词识别、词性标注等功能。

290 0

golangyanyiwu/gojieba中文分词

yanyiwu/nodejieba：”结巴”中文分词的Node.js版本

NodeJieba是"结巴"中文分词的Node.js版本实现，由CppJieba提供底层分词算法。其词典载入方式灵活，底层算法为C++性能高效，支持多种分词算法和动态补充词库，在词性标注、关键词抽取等方面也有功能实现，还有多种用法示例，是一个很实用的Node.js中文分词组件。

242 0

Node.jsyanyiwu/nodejieba中文分词结巴

jieba：结巴中文分词组件：功能强大的Python中文分词工具

jieba是一个优秀的Python中文分词组件。它支持精确、全、搜索引擎、paddle等多种分词模式，可满足不同需求。还具备词性标注、自定义词典、关键词提取等功能，并且基于高效的算法实现。在多种自然语言处理任务中有广泛应用，同时有多种其他语言的实现版本，适合开发人员在不同场景下进行中文文本处理。

326 0

jiebaPython中文分词自然语言处理

【GitHub】ansj_seg项目介绍：中文分词工具的全方位解析

ansj_seg是NLPchina在GitHub上的项目，专注于中文分词。它有着多种应用场景，但也存在局限性。本文详细介绍其项目背景、目的、核心技术等内容，欢迎讨论。