python取得文件关键词并创建词云

下面就来详细讲解Python取得文件关键词并创建词云的完整攻略,包括以下几个步骤:

  1. 安装必要的Python库:需要安装pyquery、jieba和wordcloud库,可以使用pip install命令进行安装。

  2. 获取文本数据:通过Python的文件读取操作,从指定的文本文件中获取需要进行分析的文本数据。

  3. 文本处理:使用jieba库对文本进行分词,并进行停用词过滤,得到关键词列表。

  4. 创建词云:使用wordcloud库对关键词进行处理,生成词云图片,最终实现可视化展示。

下面提供两个代码示例,分别是针对英文文本和中文文本的处理:

英文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt')) as f:
    text = f.read()

# 分词处理
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
import string

tokens = word_tokenize(text)
tokens = [w.lower() for w in tokens]
table = str.maketrans('', '', string.punctuation)
stripped = [w.translate(table) for w in tokens]
words = [word for word in stripped if word.isalpha()]
stop_words = set(stopwords.words('english'))
words = [w for w in words if not w in stop_words]

# 生成词云
wordcloud = WordCloud(width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

中文文本处理

import os
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba

# 读取文本文件
with open(os.path.join(os.getcwd(), 'input.txt'), encoding='utf-8') as f:
    text = f.read()

# 分词处理
seg_list = jieba.cut(text)
words = [word for word in seg_list if len(word)>1]

# 生成词云
wordcloud = WordCloud(font_path='STKAITI.ttf', width=800, height=800).generate(' '.join(words))
plt.figure(figsize=(8,8), facecolor=None)
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
plt.tight_layout(pad=0)
plt.show()

以上就是Python取得文件关键词并创建词云的完整攻略,希望对你有所帮助。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python取得文件关键词并创建词云 - Python技术站

(0)
上一篇 2023年4月16日
下一篇 2023年4月16日

相关文章

  • python3判断是否文件末尾

    Python3可以通过文件指针的行为来判断文件是否到达末尾。文件指针是一个特殊的变量,它指向正在读取或写入的文件中的位置。当读取或写入文件时,文件指针会随着文件的读取或写入而向前移动。如果文件指针指向文件的末尾,那么表示已经读取完整个文件。 Python3中判断文件是否到达末尾的方法如下: 使用while循环结合readline()方法逐行读取文件内容,当读…

    python 2023年4月16日
    00
  • python 内容如何写入到文件末尾

    Python可以通过以下几个步骤来将内容写入文件末尾: 打开文件 移动光标到文件末尾 写入内容 关闭文件 以下是每个步骤的代码示例: 打开文件 使用open()函数打开一个文件,其中第一个参数是文件路径和名称,第二个参数是打开方式,”a”表示以追加模式打开文件,如果文件不存在则新建。 file = open("example.txt", …

    python 2023年4月16日
    00
  • 用python如何访问文件

    Python 是一种广泛使用的脚本语言,也是数据科学、人工智能领域中的重要工具。Python 语言中有许多库可以用于文件读写、处理和转换,本文将介绍如何在 Python 中访问文件的完整攻略,包括文件打开、读写、关闭等操作。 打开文件 在 Python 中,要打开一个文件,首先需要使用 open() 函数创建一个文件对象。这个函数需要传入两个参数:文件名和打…

    python 2023年4月16日
    00
  • python打不开.py文件处理方法

    当我们在Python中打开一个.py文件但是却无法成功打开时,我们应该注意以下几点来对问题进行排查: 确认路径是否正确:首先我们应该确认路径是否正确,路径有可能写错了,导致文件无法读取。可以使用os.getcwd()获取当前文件所在路径,判断路径是否正确。 确认文件是否存在:其次,我们应该确认该文件是否存在。可以使用os.path.isfile()判断该文件…

    python 2023年4月16日
    00
  • python读取bin文件内容

    Python可以使用二进制模式读取bin文件。下面是Python读取bin文件的完整攻略: 打开文件 可以使用open()函数打开bin文件。open()函数的第二个参数表示文件的访问模式。其中,”rb”表示二进制模式打开文件,”wb”表示二进制模式写入文件。读取bin文件时,需要使用”rb”模式打开。 f = open("file.bin&quo…

    python 2023年4月16日
    00
  • python如何修改文件夹权限

    修改文件夹(及其内部所有文件)权限是Linux系统中常见的操作之一,Python作为一种跨平台的编程语言,也能够通过操作系统提供的API实现该操作。 Python中通过操作os模块来完成文件夹权限的修改。os模块提供了一些与操作系统进行交互的函数,其中包括修改文件夹权限的函数:os.chmod()。 os.chmod(path, mode)函数用于修改文件或…

    python 2023年4月16日
    00
  • python如何替换文件中的敏感词

    替换文件中的敏感词可以分为以下几个步骤: 打开文件,读取文件内容 使用正则表达式匹配需要替换的敏感词 使用替换函数将匹配的敏感词替换成指定的字符 将替换后的文本写入文件中 下面是两个代码示例来说明这个过程: 代码示例一:替换单个文件中的敏感词 import re # 定义敏感词列表 sensitive_words = [‘敏感词1’, ‘敏感词2’, ‘敏感…

    python 2023年4月16日
    00
  • python实现文件传输接口

    Python实现文件传输接口的完整攻略包括以下几个步骤: 创建HTTP服务器:使用Python中内置的http.server模块创建一个HTTP服务器,该模块提供了基本的HTTP请求处理方法。 实现文件上传的处理函数:在HTTP服务器中实现文件上传的处理函数,用于接收客户端发送的文件,并保存文件到服务器端。 搭建文件上传接口:将文件上传处理函数与HTTP服务…

    python 2023年4月16日
    00
合作推广
合作推广
分享本页
返回顶部