在Pandas中应用LEFT, RIGHT, MID的方法

Pandas中,可以使用Series.str方法结合LEFT、RIGHT和MID函数来提取字符串中的部分信息,例如提取姓名、数字等等。

首先,LEFT函数可以提取字符串的左侧若干个字符,其语法为LEFT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['First Name'] = df['Name'].str.split().str.get(0)
df['Last Name'] = df['Name'].str.split().str.get(-1)
df['Address Street'] = df['Address'].str.split().str[:-1].str.join(' ')
df['Address Number'] = df['Address'].str.split().str.get(-1)
df['Zip Code'] = df['Address Number'].str.extract(r'(\d{5})')

df['First Initial'] = df['First Name'].str.slice(stop=1)
df['Last Initial'] = df['Last Name'].str.slice(stop=1)
df['Full Initials'] = df['First Initial'] + '.' + df['Last Initial'] + '.'

df['First 3'] = df['Last Name'].str.slice(start=0, stop=3)

print(df)

输出结果为:

            Name  Age      Address First Name Last Name Address Street Address Number Zip Code First Initial Last Initial Full Initials First 3
0     John Smith   28  123 Main St       John     Smith   123 Main St              St   12345             J           S          J.S.     Smi
1  Katie Johnson   35  456 Park Ave      Katie   Johnson  456 Park Ave            Ave   45678             K           J          K.J.     Joh
2     Adam Davis   42   789 Elm St       Adam     Davis    789 Elm St              St   78995             A           D          A.D.     Dav

其次,RIGHT函数可以提取字符串右侧若干个字符,其语法为RIGHT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['Zip Code'] = df['Address'].str.split().str.get(-1).str.slice(start=-5)

print(df)

输出结果为:

            Name  Age      Address Zip Code
0     John Smith   28  123 Main St    12345
1  Katie Johnson   35  456 Park Ave    45678
2     Adam Davis   42   789 Elm St    78995

最后,MID函数可以提取字符串中间的若干个字符,其语法为MID(string, start_character, num_chars),其中string为待提取的字符串,start_character为提取的起始字符的位置(位置从1开始),num_chars为提取的字符数。例如:

import pandas as pd

s = pd.Series(['John Smith', 'Katie Johnson', 'Adam Davis'])

s = s.str.slice(start=5, stop=10)

print(s)

输出结果为:

0    Smith
1    Johns
2    Davis
dtype: object

以上就是在Pandas中应用LEFT、RIGHT和MID函数提取字符串部分信息的方法和实例。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas中应用LEFT, RIGHT, MID的方法 - Python技术站

(0)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • Python实现读取HTML表格 pd.read_html()

    当我们需要从HTML页面中读取表格数据进行进一步处理和分析时,Python中pd.read_html()函数是一个非常方便实用的方法。 1. pd.read_html()函数简介 pd.read_html()函数位于pandas模块中,可以直接从HTML页面中读取表格内容,并返回一个DataFrame类型的数据结构,可以直接用于进一步的数据处理和分析。 2.…

    python 2023年5月14日
    00
  • 在Pandas中为数据框架添加列名

    在Pandas中,我们可以使用 DataFrame 类来创建数据框架,并可以为数据框架添加列名。以下是在Pandas中为数据框架添加列名的完整攻略,包括实例说明: 1. 创建数据框架 首先,我们需要创建一个数据框架,可以使用 pandas.DataFrame() 函数: import pandas as pd data = {‘name’: [‘Alice’…

    python-answer 2023年3月27日
    00
  • Pandas div()函数的具体使用

    当我们需要对 Pandas 数据框的某一列进行除法运算时,就可以使用Pandas的 div() 函数。 div() 函数可以在 Pandas 数据框中的两个列之间执行除法运算。具体的使用方式为: df1.div(df2, fill_value=0) 其中 df1 是要进行除法操作的数据框,df2 则是用于除数的数据框。 如果两个数据框的列名不同,则需要选取对…

    python 2023年5月14日
    00
  • 如何在Pandas数据框架中把整数转换为日期时间

    将整数转换为日期时间在Pandas数据框架中非常常见,下面是具体步骤: 导入必要的库 import pandas as pd from datetime import datetime, timedelta 假设我们有一个整形数据帧df,其中“日期”列是整数形式,表示从2000年1月1日以来的天数。我们将使用以下代码将其转换为日期时间: df[‘日期’] =…

    python-answer 2023年3月27日
    00
  • 利用Python如何将数据写到CSV文件中

    当我们需要将数据保存到本地的时候,CSV是一种非常常见的数据格式。Python作为一门强大的脚本语言,也提供了非常方便的方法帮助我们把数据写到CSV文件中。 下面是利用Python将数据写到CSV文件的完整攻略: 第一步:导入必要的Python模块 要写入CSV文件,我们需要导入Python自带的csv模块。代码如下: import csv 第二步:定义CS…

    python 2023年5月14日
    00
  • Python+Pandas 获取数据库并加入DataFrame的实例

    获取数据库中的数据并将其加入到Pandas的DataFrame中,是数据分析过程中常见的步骤之一。下面,我将提供一个Python+Pandas获取数据库并加入DataFrame的实例的完整攻略。 1. 准备工作 在开始之前,你需要进行以下准备工作: 确认已经安装了Python,并安装了Pandas库和用于连接数据库的驱动程序(例如,pymysql、cx_Or…

    python 2023年5月14日
    00
  • Python pandas 的索引方式 data.loc[],data[][]示例详解

    Python pandas 的索引方式 data.loc[],data[][]示例详解 背景 在使用Python pandas的过程中,我们常常需要对数据进行索引、筛选、修改等操作。其中,使用data.loc[]和data[][]进行索引操作是比较常见和灵活的方式。接下来,我们将详细讲解这两种索引方式的使用方法和示例。 data.loc[]的使用 data.…

    python 2023年5月14日
    00
  • 获取Pandas数据框架的行数和列数

    获取Pandas数据框架(DataFrame)的行数和列数是数据分析中常用的操作。在Python中,使用Pandas库可以轻松地实现这一操作。 获取行数 要获取Pandas数据框架的行数,可以使用len()函数,将数据框架的索引取值作为参数传入,例如: import pandas as pd # 创建数据框架 df = pd.DataFrame({ ‘nam…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部