Github项目

VicWord:一个纯php的分词项目

VicWord是一个纯php的分词项目。它提供了三种切分方法,包括长度优先切分的getWord、细粒度切分的getShortWord和效果最好的getAutoWord。支持自定义词典,词库有json和igb两种格式...

标签:

【Github】项目名:VicWord – 一个纯php分词

项目简介

VicWord是一个纯php的分词项目。它有QQ交流群:731475644。安装可通过composer require lizhichao/word。该项目含有3种切分方法,分别为getWord(长度优先切分,速度最快)、getShortWord(细粒度切分,比最快慢一点)、getAutoWord(自动切分,效果最好)。同时,它可自定义词典,词库支持文本格式json和二进制格式igb(igb格式词典小,加载快),dict.igb含有175662个词。还提供了一种词性的定义方式和三种分词结果对比示例,以及分词速度在特定机器上的测试数据。此外,制作词库支持utf – 8的任意字符且词典大小不影响分词速度,有添加词语到词库的方法,并且还有一个极简高性能php框架(支持[swoole|php – fpm]环境)、clickhousetcp客户端等相关内容。

项目总结

VicWord项目为php环境下的分词提供了多种实用的功能和方式。希望大家能够对这个项目进行深入的研究,如果有任何想法或者建议,欢迎在下方留言讨论。

项目地址

GitHub链接直达

数据统计

数据评估

VicWord:一个纯php的分词项目浏览人数已经达到20,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:VicWord:一个纯php的分词项目的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找VicWord:一个纯php的分词项目的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于VicWord:一个纯php的分词项目特别声明

本站链氪巴士提供的VicWord:一个纯php的分词项目都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...