Github项目

ownthink/Jiagu:深度学习自然语言处理工具

Jiagu是一个深度学习自然语言处理工具,使用大规模语料训练而成。它能提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感...

标签:

【Github】项目名:ownthink/Jiagu:深度学习自然语言处理工具

项目简介

Jiagu是一个深度学习自然语言处理工具,它使用大规模语料训练而成。能提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感分析、文本聚类等功能,参考了各大工具的优缺点制作而成。

安装方式

可以通过pip安装,命令为pip install -U jiagu,如果比较慢,可以使用清华的pip源:pip install -U jiagu -i https://pypi.tuna.tsinghua.edu.cn/simple;也可通过源码安装,先git clone https://github.com/ownthink/Jiagu,然后cd Jiagu,最后python3 setup.py install。

使用方式示例

分词、词性标注、命名实体识别

示例代码如下:
import jiagu
#jiagu.init()#可手动初始化,也可以动态初始化
text = ‘厦门明天会不会下雨’
words = jiagu.seg(text)#分词
print(words)
pos = jiagu.pos(words)#词性标注
print(pos)
ner = jiagu.ner(words)#命名实体识别
print(ner)

知识图谱关系抽取

仅用于测试用,可以pip3 install jiagu==0.1.8,只能使用百科的描述进行测试。效果更佳的后期将会开放api。示例代码如下:
import jiagu
text = ‘姚明1980年9月12日出生于上海市徐汇区,祖籍江苏省苏州市吴江区震泽镇,前中国职业篮球运动员,司职中锋,现任中职联公司董事长兼总经理。’
knowledge = jiagu.knowledge(text)
print(knowledge)

关键词提取

示例代码如下:
import jiagu
text = ”’该研究主持者之一、波士顿大学地球与环境科学系博士陈池(音)表示,“尽管中国和印度国土面积仅占全球陆地的9%,但两国为这一绿化过程贡献超过三分之一。考虑到人口过多的国家一般存在对土地过度利用的问题,这个发现令人吃惊。”NASA埃姆斯研究中心的科学家拉玛·内曼尼(RamaNemani)说,“这一长期数据能让我们深入分析地表绿化背后的影响因素。我们一开始以为,植被增加是由于更多二氧化碳排放,导致气候更加温暖、潮湿,适宜生长。”“MODIS的数据让我们能在非常小的尺度上理解这一现象,我们发现人类活动也作出了贡献。”NASA文章介绍,在中国为全球绿化进程做出的贡献中,有42%来源于植树造林工程,对于减少土壤侵蚀、空气污染与气候变化发挥了作用。据观察者网过往报道,2017年我国全国共完成造林736.2万公顷、森林抚育830.2万公顷。其中,天然林资源保护工程完成造林26万公顷,退耕还林工程完成造林91.2万公顷。京津风沙源治理工程完成造林18.5万公顷。三北及长江流域等重点防护林体系工程完成造林99.1万公顷。完成国家储备林建设任务68万公顷。”’
keywords = jiagu.keywords(text, 5)#关键词
print(keywords)

项目总结

Jiagu是一个功能丰富的自然语言处理工具,涵盖了从基础的分词到高级的知识图谱关系抽取等多种功能,并且提供了多种安装和使用方式。希望大家能尝试使用这个工具,如果有任何想法或者问题,欢迎在评论区留言讨论。

项目地址

GitHub链接直达

数据统计

数据评估

ownthink/Jiagu:深度学习自然语言处理工具浏览人数已经达到4,如你需要查询该站的相关权重信息,可以点击"5118数据""爱站数据""Chinaz数据"进入;以目前的网站数据参考,建议大家请以爱站数据为准,更多网站价值评估因素如:ownthink/Jiagu:深度学习自然语言处理工具的访问速度、搜索引擎收录以及索引量、用户体验等;当然要评估一个站的价值,最主要还是需要根据您自身的需求以及需要,一些确切的数据则需要找ownthink/Jiagu:深度学习自然语言处理工具的站长进行洽谈提供。如该站的IP、PV、跳出率等!

关于ownthink/Jiagu:深度学习自然语言处理工具特别声明

本站链氪巴士提供的ownthink/Jiagu:深度学习自然语言处理工具都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由链氪巴士实际控制,在2024年12月6日 上午12:00收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,链氪巴士不承担任何责任。

相关导航

暂无评论

暂无评论...