在Pandas中应用LEFT, RIGHT, MID的方法

Pandas中,可以使用Series.str方法结合LEFT、RIGHT和MID函数来提取字符串中的部分信息,例如提取姓名、数字等等。

首先,LEFT函数可以提取字符串的左侧若干个字符,其语法为LEFT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['First Name'] = df['Name'].str.split().str.get(0)
df['Last Name'] = df['Name'].str.split().str.get(-1)
df['Address Street'] = df['Address'].str.split().str[:-1].str.join(' ')
df['Address Number'] = df['Address'].str.split().str.get(-1)
df['Zip Code'] = df['Address Number'].str.extract(r'(\d{5})')

df['First Initial'] = df['First Name'].str.slice(stop=1)
df['Last Initial'] = df['Last Name'].str.slice(stop=1)
df['Full Initials'] = df['First Initial'] + '.' + df['Last Initial'] + '.'

df['First 3'] = df['Last Name'].str.slice(start=0, stop=3)

print(df)

输出结果为:

            Name  Age      Address First Name Last Name Address Street Address Number Zip Code First Initial Last Initial Full Initials First 3
0     John Smith   28  123 Main St       John     Smith   123 Main St              St   12345             J           S          J.S.     Smi
1  Katie Johnson   35  456 Park Ave      Katie   Johnson  456 Park Ave            Ave   45678             K           J          K.J.     Joh
2     Adam Davis   42   789 Elm St       Adam     Davis    789 Elm St              St   78995             A           D          A.D.     Dav

其次,RIGHT函数可以提取字符串右侧若干个字符,其语法为RIGHT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['Zip Code'] = df['Address'].str.split().str.get(-1).str.slice(start=-5)

print(df)

输出结果为:

            Name  Age      Address Zip Code
0     John Smith   28  123 Main St    12345
1  Katie Johnson   35  456 Park Ave    45678
2     Adam Davis   42   789 Elm St    78995

最后,MID函数可以提取字符串中间的若干个字符,其语法为MID(string, start_character, num_chars),其中string为待提取的字符串,start_character为提取的起始字符的位置(位置从1开始),num_chars为提取的字符数。例如:

import pandas as pd

s = pd.Series(['John Smith', 'Katie Johnson', 'Adam Davis'])

s = s.str.slice(start=5, stop=10)

print(s)

输出结果为:

0    Smith
1    Johns
2    Davis
dtype: object

以上就是在Pandas中应用LEFT、RIGHT和MID函数提取字符串部分信息的方法和实例。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas中应用LEFT, RIGHT, MID的方法 - Python技术站

(0)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • pandas进行数据输入和输出的方法详解

    介绍 pandas是一个Python数据分析库,功能强大,常用于数据的处理、清洗、转换和分析。在使用pandas时,输入和输出数据是常见的操作之一。pandas提供了多种数据输入和输出的方式,包括读取csv、excel、json、sql、html等格式文件以及向这些格式文件写入数据。本文将详细讲解pandas进行数据输入和输出的方法,帮助读者充分掌握pand…

    python 2023年5月14日
    00
  • Pandas – 如何洗牌DataFrame的行数

    Pandas是Python中一个强大的数据分析库,而数据分析中常常需要对数据进行洗牌操作,也就是要对数据的行或列进行随机重排。本文将为大家详细讲解如何使用Pandas对DataFrame的行数进行洗牌,包括以下几个方面: 洗牌DataFrame的行数的原理 Pandas中洗牌DataFrame的行数的方法 代码示例及结果说明 洗牌DataFrame的行数的原…

    python-answer 2023年3月27日
    00
  • Pandas 使用制表符分离器将数据框架转为CSV文件

    导入 Pandas 库 在转换数据框架为 CSV 文件之前需要先导入 Pandas 库,代码如下: import pandas as pd 创建数据框架 为了演示数据框架如何转换为 CSV 文件,我们需要先创建一个实例数据。这里我们创建一个包含学生信息的数据框架,包含姓名、年龄、性别、所属班级、成绩等信息。 # 创建数据框架 df = pd.DataFram…

    python-answer 2023年3月27日
    00
  • 在Python-Pandas中对数据框架的所有或某些列进行循环或迭代

    在Python-Pandas中,对数据框架的所有或某些列进行循环或迭代可以通过for循环来实现。下面是详细的攻略: 对所有列循环 (1)使用df.columns来获得数据框架的列名 (2)利用for循环遍历列名,然后通过df[column_name]来访问每一列数据 下面是示例代码: import pandas as pd df = pd.read_csv(…

    python-answer 2023年3月27日
    00
  • Python Pandas使用str.rsplit()将字符串反向分割成两个List/Column

    首先,我们需要明白什么是字符串反向分割。字符串反向分割是将字符串从后往前逐个分割,并将分割后的结果以列表形式保存。 接下来,我们要使用Python的Pandas库中的str.rsplit()方法来实现字符串反向分割。str.rsplit()方法是将字符串从右至左分割,并以列表形式返回每个分割的部分。 下面是使用Python Pandas库中str.rspli…

    python-answer 2023年3月27日
    00
  • 在Pandas中从多索引恢复到单索引数据框架

    从多级索引恢复为单级索引的过程非常简单,只需要用reset_index方法即可。下面分别说明: 首先,让我们创建一个多级索引的Pandas DataFrame作为示例: import pandas as pd # 创建多级索引的DataFrame df = pd.DataFrame({ ‘city’: [‘Beijing’, ‘Beijing’, ‘Shan…

    python-answer 2023年3月27日
    00
  • 在Pandas Python中从数据框架中选择任何行

    在 Pandas Python 中,可以通过行索引或布尔条件从数据框中选择行。下面我将介绍在 Pandas Python 中从数据框架中选择任何行的完整攻略,并提供一个简单的示例。 1. 选择单个行或多个行的子集 要选择单个行或多个行的子集,可以使用 loc 和 iloc 方法。 loc 方法使用标签索引, iloc 方法使用整数索引。如果要选择所有行,可以…

    python-answer 2023年3月27日
    00
  • Pandas 最常用的两种排序方法

    Pandas提供了两种排序方式:按标签排序和按数值排序。 按标签排序 按标签排序使用 .sort_index() 方法,可以按照索引的标签进行排序,默认为升序排列。例如: import pandas as pd # 创建一个示例DataFrame df = pd.DataFrame({'col1': [3, 1, 2], 'co…

    Pandas 2023年3月5日
    00
合作推广
合作推广
分享本页
返回顶部