在Pandas中从Dataframe中提取所有大写单词

2023年3月27日下午2:58 • python-answer

yizhihongxing

在Pandas中提取Dataframe中所有大写单词的方法有多种。下面详细介绍其中两种方法。

方法一：使用正则表达式

可以使用正则表达式 r'\b[A-Z]+\b' 来匹配所有大写单词。

import pandas as pd
import re

# 生成示例数据
df = pd.DataFrame({'col1': ['ONE TWO', 'THREE', 'four FIVE six', '7EIGHT']})

# 定义正则表达式
pattern = r'\b[A-Z]+\b'

# 将正则表达式应用于DataFrame
df_upper = df.applymap(lambda x: re.findall(pattern, str(x)))

# 取出所有匹配项
upper_list = [item for sublist in df_upper.values.tolist() for item in sublist]

# 打印结果
print(upper_list)

输出结果：

['ONE', 'TWO', 'THREE', 'FIVE', 'EIGHT']

方法二：使用isupper()函数

另一种方法是使用字符串函数 isupper()。这个函数可以检查字符串是否全由大写字母组成。因此，可以遍历Dataframe中的每个元素，并检查它是否全由大写字母组成，如果是，将其添加到新列表中。

import pandas as pd

# 生成示例数据
df = pd.DataFrame({'col1': ['ONE TWO', 'THREE', 'four FIVE six', '7EIGHT']})

# 遍历Dataframe并提取大写单词
upper_list = []
for row in df.itertuples():
    for val in row[1].split():
        if val.isupper():
            upper_list.append(val)

# 打印结果
print(upper_list)

输出结果：

['ONE', 'TWO', 'THREE', 'FIVE', 'EIGHT']

注意，这种方法只适用于Dataframe中单元格中只有一个单词的情况。如果您想提取包含多个单词的大写单词，您需要在上面的示例中添加更多的代码来将多个单词组合在一起，并进行isupper()检查。

以上两种方法都可以提取Dataframe中的所有大写单词，并将它们存储在列表中。具体方法取决于您的数据和需要。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：在Pandas中从Dataframe中提取所有大写单词 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

使用Regex从Dataframe的指定列中提取标点符号

上一篇 2023年3月27日

使用Regex从给定的Pandas DataFrame的指定列中提取日期

下一篇 2023年3月27日

pandas初学者容易犯的六个错误总结

Pandas初学者容易犯的六个错误总结 Pandas是Python数据科学领域中最常用的库之一，用于数据的清洗、转换、整合和可视化等操作。但是，初学者在使用Pandas时往往会遇到一些常见的问题和错误。本篇文章将对这些常见错误进行总结和解决。 1. 不理解数据结构在使用Pandas之前，需要了解Pandas的两个主要数据结构：Series和DataFram…

python 2023年5月14日
000
pandas 读取各种格式文件的方法

当我们在数据分析的过程中，常常需要从各种各样的文件（CSV、Excel、SQL、JSON等）中读取数据。而在Python数据分析领域中，使用pandas库进行数据读取是非常常见的选择。本文将详细介绍pandas读取各种格式文件的方法，涵盖CSV、Excel、SQL、JSON等格式。一、读取CSV文件 CSV文件是最常见的一种数据文件格式。读取CSV文件是p…

python 2023年5月14日
000
Pandas.concat连接DataFrame,Series的示例代码

Pandas是Python中非常实用的数据分析库之一，它提供了许多方便的函数和工具来进行数据预处理、清洗、分析、可视化等任务。其中，Pandas.concat()函数可用于连接不同的DataFrame或Series对象，也是常用的数据合并操作之一。下面，我们将通过两个示例来详细讲解Pandas.concat连接DataFrame和Series的示例代码攻略…

python 2023年5月14日
000
CentOS7.4开机出现welcome to emergency mode的解决方法

下面我将为大家详细讲解“CentOS7.4开机出现welcometoemergencymode的解决方法”的完整攻略。主要步骤如下：步骤一：进入紧急模式当系统启动时，如果出现“welcome to emergency mode”的提示，表示系统已经进入了救援模式，需要进行修复。此时，我们需要进入紧急模式。示例一： $ systemctl default…

python 2023年5月14日
001
在Pandas数据框架中添加带有默认值的列

在 Pandas 数据框架中添加带有默认值的列，我们可以通过以下步骤实现。首先，我们需要导入 Pandas 库，并创建一个示例数据框架。 import pandas as pd # 创建示例数据框架 df = pd.DataFrame({‘name’:[‘Alice’, ‘Bob’, ‘Charlie’], ‘age’:[25, 30, 35]}) pri…

python-answer 2023年3月27日
000
如何按组大小对分组的Pandas数据框进行排序

按组大小对分组的Pandas数据框进行排序是数据分析中经常需要进行的一项任务。下面是按组大小对分组的Pandas数据框进行排序的完整攻略： 1. 读取数据首先，我们需要使用Pandas读取数据。这里以读取一个CSV文件为例，代码如下： import pandas as pd df = pd.read_csv(‘data_file.csv’) 2. 对数据进…

python-answer 2023年3月27日
002
对pandas replace函数的使用方法小结

对pandas库中的replace()函数进行总结。 replace()函数概述 replace()函数是一种非常方便的文本替换函数，可以替换DataFrame、Series、Index等对象中的某一个值。其语法如下： DataFrame.replace(to_replace=None, value=None, inplace=False, limit=N…

python 2023年5月14日
000
Python Pandas – 返回区间的中点

当我们在Python Pandas中处理数据的时候，有时候需要计算每个区间的中点。这个操作需要用到Pandas的cut函数和groupby函数。首先，我们需要将数据分成区间。我们可以使用cut函数来实现这个目的。cut函数接收一个数据集和一个区间列表，它返回一个Categorical对象，即分组好的数据集。 import pandas as pd # 生成…

python-answer 2023年3月27日
002

合作推广

合作推广

返回顶部