python取得文件关键词并创建词云

下面就来详细讲解Python取得文件关键词并创建词云的完整攻略,包括以下几个步骤:

  1. 安装必要的Python库:需要安装pyquery、jieba和wordcloud库,可以使用pip install命令进行安装。

  2. 获取文本数据:通过Python的文件读取操作,从指定的文本文件中获取需要进行分析的文本数据。

  3. 文本处理:使用jieba库对文本进行分词,并进行停用词过滤,得到关键词列表。

  4. 创建词云:使用wordcloud库对关键词进行处理,生成词云图片,最终实现可视化展示。

下面提供两个代码示例,分别是针对英文文本和中文文本的处理:

英文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt')) as f:
    text = f.read()

# 分词处理
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
import string

tokens = word_tokenize(text)
tokens = [w.lower() for w in tokens]
table = str.maketrans('', '', string.punctuation)
stripped = [w.translate(table) for w in tokens]
words = [word for word in stripped if word.isalpha()]
stop_words = set(stopwords.words('english'))
words = [w for w in words if not w in stop_words]

# 生成词云
wordcloud = WordCloud(width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

中文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt'), encoding='utf-8') as f:
    text = f.read()

# 分词处理
seg_list = jieba.cut(text)
words = [word for word in seg_list if len(word)>1]

# 生成词云
wordcloud = WordCloud(font_path='STKAITI.ttf', width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

以上就是Python取得文件关键词并创建词云的完整攻略,希望对你有所帮助。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python取得文件关键词并创建词云 - Python技术站

(0)
上一篇 2023年4月16日
下一篇 2023年4月16日

相关文章

  • python读取文件某几列某列方法

    Python中读取文件某几列的方法主要有两种:一种是使用pandas库,另一种是使用Python内置函数。 一、使用pandas库 首先要安装pandas库,可以在命令行中输入以下命令: pip install pandas 使用pandas读取文件,可以使用pandas的read_csv函数。例如: import pandas as pd # 读取csv文…

    python 2023年4月16日
    00
  • python常见文件类型有哪些

    Python中常见的文件类型有以下几种: 文本文件:文本文件是以文本形式存储数据的文件,其内容可以被读取和理解。在Python中,可以使用内置函数open()打开文本文件,并使用read()函数读取文本文件中的内容。 示例代码: file = open("path/to/text/file.txt", "r") con…

    python 2023年4月16日
    00
  • python同时下载多个文件

    针对Python同时下载多个文件的问题,可以采用多线程或协程的方式解决,本篇回答主要针对常用的多线程方式进行讲解。下面是具体的攻略: 1. 准备工作 在开始编写下载脚本之前,我们需要先明确下载目标并获取下载链接,这样才能完成后续的多线程下载。同时还需要确定的是文件下载存放的位置以及文件名(也可以从链接中解析出来)。这里以下载三个文件为例,下载链接如下: ht…

    python 2023年4月16日
    00
  • python如何进入文件夹

    在Python中,进入文件夹可以使用os模块来完成。具体的过程包括以下几个步骤: 导入os模块,使用import语句 使用os.chdir()方法进入目标文件夹 下面是具体的示例代码: import os #示例1:进入当前文件夹下的子文件夹 os.chdir(‘./子文件夹名’) 上面的代码,将当前工作目录(即Python脚本的工作目录)切换到了当前文件夹…

    python 2023年4月16日
    00
  • 用python如何访问文件

    Python 是一种广泛使用的脚本语言,也是数据科学、人工智能领域中的重要工具。Python 语言中有许多库可以用于文件读写、处理和转换,本文将介绍如何在 Python 中访问文件的完整攻略,包括文件打开、读写、关闭等操作。 打开文件 在 Python 中,要打开一个文件,首先需要使用 open() 函数创建一个文件对象。这个函数需要传入两个参数:文件名和打…

    python 2023年4月16日
    00
  • python查看csv文件方法

    当我们需要处理CSV文件时, Python 为我们提供了csv模块,使用该模块,我们能够打开、读取、写入和关闭 CSV 文件。 下面是 Python 查看 CSV 文件的完整攻略: 导入csv模块 首先,我们需要导入csv模块,如下所示: import csv 打开CSV文件 使用 csv module 打开 CSV 文件的第一步是使用 open() 函数打…

    python 2023年4月16日
    00
  • python中如何运行其他的py文件

    在Python中运行其他的.py文件有多种方法,下面介绍其中两种较为常见的方法: 使用import语句 在Python中,我们可以使用import语句来导入并运行其他的.py文件。这种方法需要被导入的.py文件中包含可执行的代码,例如函数、类、变量等。具体的步骤如下: 在需要引入其他文件的.py文件中,使用import语句来导入其他.py文件,语法如下所示:…

    python 2023年4月16日
    00
  • python 内容如何写入到文件末尾

    Python可以通过以下几个步骤来将内容写入文件末尾: 打开文件 移动光标到文件末尾 写入内容 关闭文件 以下是每个步骤的代码示例: 打开文件 使用open()函数打开一个文件,其中第一个参数是文件路径和名称,第二个参数是打开方式,”a”表示以追加模式打开文件,如果文件不存在则新建。 file = open("example.txt", …

    python 2023年4月16日
    00
合作推广
合作推广
分享本页
返回顶部