在Python中计算数据框中的单词[重复]

2023年4月8日上午1:51 • Python开发

【问题标题】：Counting Words in a Dataframe in Python [duplicate]在Python中计算数据框中的单词[重复]
【发布时间】：2023-04-03 11:12:01
【问题描述】：

我已使用 pandas 将 CSV 文件导入 Python。该文件由 3 列和 498 行组成。我只需要一个名为“描述”的列的字数。我通过将“描述”列转换为小写，删除英文停用词和拆分来清理文件。

输入：

    import pandas as pd

    df = pd.read_csv("capex_motscles.csv")

    from nltk.corpus import stopwords
    stop = stopwords.words('english') 

    Description3 = df['Description'].str.lower().apply(lambda x: 
    ''.join([word for word in str(x).split() if word not in (stop)]))

    print(Description3)

输出：

    0      crazy mind california medical service data base...
    1      california licensed producer recreational & medic...
    2      silicon valley data clients live beyond status...
    3      mycrazynotes inc. announces $144.6 million expans...
    4      leading provider sustainable energy company prod ...
    5      livefreecompany founded 2005, listed new york stock...

我从“print(Description3)”中提供了 5 行。我总共有 498 行，如前所述，我需要计算词频。
任何帮助将不胜感激，感谢您的宝贵时间！

【问题讨论】：

你标记了nltk，你试过了吗？
查看 collections.Counter — 数词的好方法
谢谢，我去柜台看看。我没有尝试 nltk，因为我仍然不精通 Python。但我也会调查一下。

标签：
python
python-3.x
pandas
nltk
stop-words

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：在Python中计算数据框中的单词[重复] - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

csv文件行中每列的Python唯一值

上一篇 2023年4月8日

Python：从请求库转换为 urllib3

下一篇 2023年4月8日

pip 安装库比较慢的解决方法(国内镜像)

下面是pip安装库比较慢的解决方法，以及使用国内镜像的完整攻略。问题描述在使用pip命令安装Python库时，可能会遇到下载速度比较慢的问题，尤其是在国外服务器上的库。这种情况下，需要使用国内镜像来提高下载速度。解决方法使用国内镜像来加速pip的下载速度有两种方法：方法1：配置环境变量将pip源修改成国内镜像，并将国内镜像的地址配置成pip使用的…

python 2023年5月14日
000
分享13个好用到起飞的Python技巧

分享13个好用到起飞的Python技巧攻略简介 Python是一种高级编程语言，当前在Web开发、数据分析、人工智能等领域广泛应用。在Python编程中，掌握一些技巧对于提高开发效率和编写高质量的代码都十分有帮助。以下是13个好用到起飞的Python技巧攻略。好用到起飞的技巧把列表中的元素反转 my_list = [1, 2, 3, 4, 5] my_…

python 2023年5月30日
000
Python如何快速上手? 快速掌握一门新语言的方法

Python如何快速上手：快速掌握一门新语言的方法学习Python的前置知识在学习Python之前，有一些前置知识是必要的，如基础的编程概念和算法思想。如果你没有这些基础，建议先学习一下基础的编程知识，掌握C语言和数据结构、算法等基础课程。 Python学习资源 Python学习资源丰富，包括网络课程、电子书、官方文档和社区等。以下是一些学习Python…

python 2023年5月19日
000
Python3安装模块报错Microsoft Visual C++ 14.0 is required的解决方法

在Python3中安装模块时，有时会遇到Microsoft Visual C++ 14.0 is required的错误提示。这个错误通常是由于缺少Microsoft Visual C++ 14.0运行库引起的。攻略将提供Python3安装模块报错Microsoft Visual C++14.0 is required的解决方法，包括常见错误类型和解决，并提…

python 2023年5月13日
000
Python爬取商家联系电话以及各种数据的方法

在本攻略中，我们将介绍如何使用Python爬取商家联系电话以及各种数据。以下是一个完整攻略，包括两个示例。步骤1：确定目标网站首先，我们需要确定目标网站，以便爬取商家联系电话以及各种数据。我们可以使用Python的requests库来获取网页内容，使用BeautifulSoup库来解析HTML文档。步骤2：分析网页结构接下来，我们需要分析目标网站的网…

python 2023年5月15日
000
python datetime中strptime用法详解

Python datetime中strptime用法详解在Python中，有一个datetime模块可以处理日期和时间。其中，strptime函数可以帮助我们将字符串转换为datetime格式，适用于将字符串日期转化为datetime格式日期。本篇攻略将介绍Python datetime中的strptime函数的用法以及相关注意事项。 strptime函数…

python 2023年6月2日
001
Python如何实现文本转语音

一、Python如何实现文本转语音 Python中实现文本转语音，需要安装第三方库Text-to-Speech（TTS）。安装TTS库 TTS库有多种，以下列出几个比较流行的TTS库： pyttsx3，支持多个TTS引擎，支持Python 2和3，支持多种操作系统。 gTTS，使用谷歌TTS引擎，支持Python 2和3，需要联网。 pyttsx，支持多个…

python 2023年5月19日
002
详解python脚本自动生成需要文件实例代码

关于“详解python脚本自动生成需要文件实例代码”的攻略，步骤如下：步骤一：准备工作首先，我们需要安装pipenv，它是Python虚拟环境的管理器。可以使用以下命令进行安装： pip install pipenv 我们还需要安装相关依赖库： pipenv install jinja2 步骤二：编写jinja2模板文件在这个例子中，我们将使用Jin…

python 2023年5月19日
000

合作推广

合作推广

返回顶部