pyhanlp安装介绍和简单应用攻略
简介
pyhanlp是HanLP在Python平台上的接口,支持自然语言处理功能的开发和应用。HanLP是一个自然语言处理工具包,提供了中文分词、词性标注、命名实体识别、依存句法分析等多种自然语言处理工具。
安装步骤
- 安装Java JDK(JDK 8及以上版本)
sudo apt-get install openjdk-8-jdk
- 安装HanLP
pip install pyhanlp
简单应用示例
中文分词和词性标注
from pyhanlp import *
text = "今天天气真好啊,我们可以去公园玩"
segment = HanLP.newSegment().enablePartOfSpeechTagging(True)
term_list = segment.seg(text)
for term in term_list:
print(term.word, term.nature)
以上代码使用pyhanlp实现了中文分词和词性标注,将句子进行分词并得到每个词的词性。程序输出结果如下:
今天 t
天气 n
真好 a
啊 yg
, x
我们 r
可以 v
去 v
公园 ns
玩 vn
命名实体识别
from pyhanlp import *
text = "刘德华是香港的国际巨星,他曾经主演了《无间道》、《少林寺》等多部影视作品"
segment = HanLP.newSegment().enableNameRecognize(True)
term_list = segment.seg(text)
for term in term_list:
if str(term.nature).startswith("nr"):
print(term.word)
以上代码使用pyhanlp实现了命名实体识别,将句子中的人名识别出来。程序输出结果如下:
刘德华
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pyhanlp安装介绍和简单应用 - Python技术站