python取得文件关键词并创建词云

2023年4月16日下午6:28 • python

下面就来详细讲解Python取得文件关键词并创建词云的完整攻略，包括以下几个步骤：

安装必要的Python库：需要安装pyquery、jieba和wordcloud库，可以使用pip install命令进行安装。
获取文本数据：通过Python的文件读取操作，从指定的文本文件中获取需要进行分析的文本数据。
文本处理：使用jieba库对文本进行分词，并进行停用词过滤，得到关键词列表。
创建词云：使用wordcloud库对关键词进行处理，生成词云图片，最终实现可视化展示。

下面提供两个代码示例，分别是针对英文文本和中文文本的处理：

英文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt')) as f:
    text = f.read()

# 分词处理
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
import string

tokens = word_tokenize(text)
tokens = [w.lower() for w in tokens]
table = str.maketrans('', '', string.punctuation)
stripped = [w.translate(table) for w in tokens]
words = [word for word in stripped if word.isalpha()]
stop_words = set(stopwords.words('english'))
words = [w for w in words if not w in stop_words]

# 生成词云
wordcloud = WordCloud(width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

中文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt'), encoding='utf-8') as f:
    text = f.read()

# 分词处理
seg_list = jieba.cut(text)
words = [word for word in seg_list if len(word)>1]

# 生成词云
wordcloud = WordCloud(font_path='STKAITI.ttf', width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

以上就是Python取得文件关键词并创建词云的完整攻略，希望对你有所帮助。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python取得文件关键词并创建词云 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

python默认的安装路径在哪

上一篇 2023年4月16日

python文件处理基础知识

下一篇 2023年4月16日

python3判断是否文件末尾

Python3可以通过文件指针的行为来判断文件是否到达末尾。文件指针是一个特殊的变量，它指向正在读取或写入的文件中的位置。当读取或写入文件时，文件指针会随着文件的读取或写入而向前移动。如果文件指针指向文件的末尾，那么表示已经读取完整个文件。 Python3中判断文件是否到达末尾的方法如下：使用while循环结合readline()方法逐行读取文件内容，当读…

python 2023年4月16日
000
python 内容如何写入到文件末尾

Python可以通过以下几个步骤来将内容写入文件末尾：打开文件移动光标到文件末尾写入内容关闭文件以下是每个步骤的代码示例：打开文件使用open()函数打开一个文件，其中第一个参数是文件路径和名称，第二个参数是打开方式，”a”表示以追加模式打开文件，如果文件不存在则新建。 file = open("example.txt", …

python 2023年4月16日
000
用python如何访问文件

Python 是一种广泛使用的脚本语言，也是数据科学、人工智能领域中的重要工具。Python 语言中有许多库可以用于文件读写、处理和转换，本文将介绍如何在 Python 中访问文件的完整攻略，包括文件打开、读写、关闭等操作。打开文件在 Python 中，要打开一个文件，首先需要使用 open() 函数创建一个文件对象。这个函数需要传入两个参数：文件名和打…

python 2023年4月16日
000
python打不开.py文件处理方法

当我们在Python中打开一个.py文件但是却无法成功打开时，我们应该注意以下几点来对问题进行排查：确认路径是否正确：首先我们应该确认路径是否正确，路径有可能写错了，导致文件无法读取。可以使用os.getcwd()获取当前文件所在路径，判断路径是否正确。确认文件是否存在：其次，我们应该确认该文件是否存在。可以使用os.path.isfile()判断该文件…

python 2023年4月16日
000
python读取bin文件内容

Python可以使用二进制模式读取bin文件。下面是Python读取bin文件的完整攻略：打开文件可以使用open()函数打开bin文件。open()函数的第二个参数表示文件的访问模式。其中，”rb”表示二进制模式打开文件，”wb”表示二进制模式写入文件。读取bin文件时，需要使用”rb”模式打开。 f = open("file.bin&quo…

python 2023年4月16日
000
python如何修改文件夹权限

修改文件夹（及其内部所有文件）权限是Linux系统中常见的操作之一，Python作为一种跨平台的编程语言，也能够通过操作系统提供的API实现该操作。 Python中通过操作os模块来完成文件夹权限的修改。os模块提供了一些与操作系统进行交互的函数，其中包括修改文件夹权限的函数：os.chmod()。 os.chmod(path, mode)函数用于修改文件或…

python 2023年4月16日
000
python如何替换文件中的敏感词

替换文件中的敏感词可以分为以下几个步骤：打开文件，读取文件内容使用正则表达式匹配需要替换的敏感词使用替换函数将匹配的敏感词替换成指定的字符将替换后的文本写入文件中下面是两个代码示例来说明这个过程：代码示例一：替换单个文件中的敏感词 import re # 定义敏感词列表 sensitive_words = [‘敏感词1’, ‘敏感词2’, ‘敏感…

python 2023年4月16日
000
python实现文件传输接口

Python实现文件传输接口的完整攻略包括以下几个步骤：创建HTTP服务器：使用Python中内置的http.server模块创建一个HTTP服务器，该模块提供了基本的HTTP请求处理方法。实现文件上传的处理函数：在HTTP服务器中实现文件上传的处理函数，用于接收客户端发送的文件，并保存文件到服务器端。搭建文件上传接口：将文件上传处理函数与HTTP服务…

python 2023年4月16日
001

合作推广

合作推广

返回顶部