Python pyecharts绘制词云图代码

下面是Python pyecharts绘制词云图的完整攻略:

简介

pyecharts(Python echarts)是一款基于Echarts语法的Python可视化库,支持多种可视化类型的展示,其中就包括了词云图(WordCloud)。

准备工作:

  1. 安装pyecharts库

pip install pyecharts

  1. 从所需爬取的文本中获取分词

pyecharts中的WordCloud要求传入一份分好词的词频数据,故我们需要将文本进行分词。可以使用Python中常用的分词库如jieba库进行分词实现,示例代码:

```python
import jieba

text = "Python是一门非常流行的编程语言,它简洁易学,使用广泛。"
# 通过jieba库进行中文分词,返回分词结果,类型为列表
seg_list = jieba.lcut(text, cut_all=False)
print(seg_list)
# 输出结果:['Python', '是', '一门', '非常', '流行', '的', '编程语言', ',', '它', '简洁', '易学', ',', '使用', '广泛', '。']
```

代码实现:

以下代码实现了根据传入的词频数据生成词云图的功能,在调用WordCloud()时,需要传入一个字典类型的数据,其中以词语为键,以词频为值(如:{'Python': 10, '编程': 5}),表示该词语在文本中出现的频率:

from pyecharts import options as opts
from pyecharts.charts import WordCloud

# 传入的词频数据,类型为字典
word_freq = {
    'Python': 10,
    '编程': 5,
    '语言': 7,
    '数据分析': 3,
    '机器学习': 4,
    '可视化': 2
}

# 生成词云图,并设置词云图的样式
wordcloud = (
    WordCloud(init_opts=opts.InitOpts(width='800px', height='400px'))
    .add(series_name='', data_pair=word_freq.items(), word_gap=10, rotate_step=90, shape='roundRect')
    .set_global_opts(
        title_opts=opts.TitleOpts(title='词云图'),
        tooltip_opts=opts.TooltipOpts(is_show=True),
        visualmap_opts=opts.VisualMapOpts(max_=10),
    )
    .render(path='wordcloud.html')
)

示例说明:

下面演示两个实际应用的案例:

  1. 网络爬虫爬取词频数据

使用Python官方库的urllib进行网络爬虫,获取网络信息,并使用jieba库进行分词,代码如下:

```python
import urllib.request
import jieba

url = "http://news.sina.com.cn/"
response = urllib.request.urlopen(url)
html = response.read()
# 利用正则表达式提取文本内容
import re
pattern = re.compile(r'<[^>]+>', re.S)
content = pattern.sub('', html.decode())
# 使用jieba库进行分词
seg_list = jieba.lcut(content, cut_all=True)
word_freq = {}
for word in seg_list:
if len(word) > 1: # 去掉单个的字
word_freq[word] = word_freq.get(word, 0) + 1
```

将所获得的分词结果作为数据项传入到WordCloud中,即可生成网络新闻页面的词云图。

  1. 从CSV文件中读取词频数据

利用Python内置的csv库读取CSV文件中的数据,并将其存储为字典,代码如下:

```python
import csv

with open('word_freq.csv', 'r', encoding='utf-8') as f:
csv_reader = csv.reader(f)
word_freq = {}
for row in csv_reader:
word_freq[row[0]] = int(row[1])
```

将所获得的分词结果作为数据项传入到WordCloud中,即可生成CSV中的词云图。

结论

pyecharts库在各类数据可视化中都有着十分出色的表现,特别是在设计词云图方面更是如此,只需要几行代码即可制作出复杂、美观的词云图,并且支持多种图形效果的设置和自定义。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python pyecharts绘制词云图代码 - Python技术站

(0)
上一篇 2023年5月18日
下一篇 2023年5月18日

相关文章

  • python的函数和方法(中)

    Python的函数和方法(中): 在Python中,函数和方法是两个重要的概念。函数是一个独立的代码块,可被多次调用,用于完成一定的功能。方法是对象中的函数,它是一个与对象相关联的函数。本文将探讨Python中函数和方法的更多知识点。 函数参数: Python中函数的参数可以有默认值,也可以为可变参数。默认值参数表示,当函数没有传递这个参数时,它使用默认值。…

    python 2023年6月5日
    00
  • 浅谈Python xlwings 读取Excel文件的正确姿势

    浅谈Pythonxlwings读取Excel文件的正确姿势 介绍 Pythonxlwings是一个Python库,它使得Python可以与Excel文件进行互动。可以使用xlwings来读取、写入或修改Excel文件中的数据,同时也可以控制Excel应用程序的行为。 安装 安装xlwings最简单的方法是使用pip,命令如下: pip install xlw…

    python 2023年5月13日
    00
  • 基于Python 中函数的 收集参数 机制

    基于Python中函数的收集参数机制,可以分为两种:收集位置参数和收集关键字参数。 收集位置参数 如果函数不确定需要传入多少个位置参数,可以使用收集位置参数的方式。以下是示例代码: def sum_all_numbers(*args): total = 0 for num in args: total += num return total print(su…

    python 2023年6月5日
    00
  • Python常用模块之threading和Thread模块及线程通信

    Python常用模块之threading和Thread模块及线程通信 简介 Python中可以使用Thread模块和threading模块来创建线程。其中Thread模块是低级模块,用于低级别的线程控制,而threading模块是高级模块,对Thread模块进行了封装,使得线程更加方便使用。本文将对这两个模块进行详细讲解,并讨论线程之间是如何进行通信的。 基…

    python 2023年5月19日
    00
  • python多线程高级锁condition简单用法示例

    当我们使用python中的多线程编程时,有一些共享的资源需要被不同的线程访问和修改,但是同时又需要保证同一时间只有一个线程能够访问和修改这些共享资源,否则就会出现数据不一致的情况。这时候就需要使用同步机制,而pythond的高级锁Condition就能够很好地完成这项工作。 下面我们来详细介绍一下Condition的使用方法,分别有以下几个方面: Condi…

    python 2023年5月19日
    00
  • 基于Python词云分析政府工作报告关键词

    如果您想使用Python对政府工作报告中的关键词进行词云分析,可以按照以下步骤进行。 1. 获取政府工作报告原始文本 首先需要获取原始的政府工作报告文本,在可以进行分析前,需要将文件下载到本地,可以使用Python中的requests库进行下载,示例代码如下: import requests url = "http://www.gov.cn/pre…

    python 2023年6月6日
    00
  • Python类及获取对象属性方法解析

    Python类及获取对象属性方法解析 Python是一种面向对象的编程语言,类是Python中面向对象编程的基础。类是一种抽象的数据类型,用于描述具有相同属性和方法的对象。本文将详细讲解Python类及获取对象属性方法,并提供两个示例。 Python类的定义 Python类是一种抽象的数据类型,用于描述具有相同属性和方法的对象。类定义了对象的属性和方法,对象…

    python 2023年5月15日
    00
  • 用python写的一个wordpress的采集程序

    下面是详细讲解用 Python 写的 WordPress 采集程序的完整攻略。 什么是 WordPress 采集程序 WordPress 采集程序是一种自动化爬虫程序,用于采集 WordPress 站点上的文章、标签、分类等内容,并把采集的数据转化为特定格式,以备后续处理。采集程序可以帮助我们快速获取需要的数据,从而提高数据处理效率。 如何编写 WordPr…

    python 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部