这里是关于“python中wordcloud安装的方法小结”的完整攻略。
1. 安装wordcloud模块
要在Python中使用wordcloud,需要首先安装wordcloud模块。常用的方法是使用pip命令进行安装:
pip install wordcloud
对于在Windows系统中使用Anaconda的Python用户,也可以使用conda命令进行安装:
conda install -c conda-forge wordcloud
2. 安装中文字体(可选)
如果需要使用中文生成词云图,建议安装中文字体。这里以SimHei字体为例。首先下载字体文件,然后将其拷贝到系统字体目录中,最后使用以下代码测试:
import matplotlib.pyplot as plt
from wordcloud import WordCloud
font_path = r'C:\Windows\Fonts\simhei.ttf'
text = 'test 中文'
wordcloud = WordCloud(font_path=font_path).generate(text)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()
示例1:生成英文词云
下面是一个示例代码,演示如何使用wordcloud生成英文词云:
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS
# 读取文本文件
with open('alice.txt', 'r') as f:
text = f.read()
# 设置停用词
stopwords = set(STOPWORDS)
stopwords.add("said")
# 生成词云图像
wordcloud = WordCloud(
background_color='white', # 背景颜色
stopwords=stopwords, # 停用词
max_words=100, # 最大词数
width=800, height=400, # 图片大小
random_state=42, # 随机数
).generate(text)
# 显示图片
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
在这个示例中,我们使用了《爱丽丝梦游仙境》一书的文本,设置了一些停用词(例如“said”),并生成了一个图片大小为800x400像素、最大词数为100的词云。
示例2:生成中文词云
下面是另一个示例代码,演示如何使用wordcloud生成中文词云:
import jieba
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS
# 读取文本文件
with open('news.txt', 'r', encoding='utf-8') as f:
text = f.read()
# 精确分词
seg_list = jieba.cut(text, cut_all=False)
# 将分词结果拼接成空格分隔的字符串
text = " ".join(seg_list)
# 设置停用词
stopwords = set(STOPWORDS)
stopwords.add("美国")
# 生成词云图像
wordcloud = WordCloud(
font_path='simhei.ttf', # 中文字体
background_color='white', # 背景颜色
stopwords=stopwords, # 停用词
max_words=100, # 最大词数
width=800, height=400, # 图片大小
random_state=42, # 随机数
).generate(text)
# 显示图片
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.show()
在这个示例中,我们使用了新闻文本文件,使用了jieba对文本进行了精确分词,设置了一些停用词(例如“美国”),并生成了一个图片大小为800x400像素、最大词数为100的词云。注意,中文字体需要提前安装好。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中wordcloud安装的方法小结 - Python技术站