在Pandas中应用LEFT, RIGHT, MID的方法

Pandas中,可以使用Series.str方法结合LEFT、RIGHT和MID函数来提取字符串中的部分信息,例如提取姓名、数字等等。

首先,LEFT函数可以提取字符串的左侧若干个字符,其语法为LEFT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['First Name'] = df['Name'].str.split().str.get(0)
df['Last Name'] = df['Name'].str.split().str.get(-1)
df['Address Street'] = df['Address'].str.split().str[:-1].str.join(' ')
df['Address Number'] = df['Address'].str.split().str.get(-1)
df['Zip Code'] = df['Address Number'].str.extract(r'(\d{5})')

df['First Initial'] = df['First Name'].str.slice(stop=1)
df['Last Initial'] = df['Last Name'].str.slice(stop=1)
df['Full Initials'] = df['First Initial'] + '.' + df['Last Initial'] + '.'

df['First 3'] = df['Last Name'].str.slice(start=0, stop=3)

print(df)

输出结果为:

            Name  Age      Address First Name Last Name Address Street Address Number Zip Code First Initial Last Initial Full Initials First 3
0     John Smith   28  123 Main St       John     Smith   123 Main St              St   12345             J           S          J.S.     Smi
1  Katie Johnson   35  456 Park Ave      Katie   Johnson  456 Park Ave            Ave   45678             K           J          K.J.     Joh
2     Adam Davis   42   789 Elm St       Adam     Davis    789 Elm St              St   78995             A           D          A.D.     Dav

其次,RIGHT函数可以提取字符串右侧若干个字符,其语法为RIGHT(string, num_chars),其中string为待提取的字符串,num_chars为提取的字符数。例如:

import pandas as pd

df = pd.DataFrame({'Name':['John Smith', 'Katie Johnson', 'Adam Davis'],
                   'Age':[28, 35, 42],
                   'Address':['123 Main St', '456 Park Ave', '789 Elm St']})

df['Zip Code'] = df['Address'].str.split().str.get(-1).str.slice(start=-5)

print(df)

输出结果为:

            Name  Age      Address Zip Code
0     John Smith   28  123 Main St    12345
1  Katie Johnson   35  456 Park Ave    45678
2     Adam Davis   42   789 Elm St    78995

最后,MID函数可以提取字符串中间的若干个字符,其语法为MID(string, start_character, num_chars),其中string为待提取的字符串,start_character为提取的起始字符的位置(位置从1开始),num_chars为提取的字符数。例如:

import pandas as pd

s = pd.Series(['John Smith', 'Katie Johnson', 'Adam Davis'])

s = s.str.slice(start=5, stop=10)

print(s)

输出结果为:

0    Smith
1    Johns
2    Davis
dtype: object

以上就是在Pandas中应用LEFT、RIGHT和MID函数提取字符串部分信息的方法和实例。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas中应用LEFT, RIGHT, MID的方法 - Python技术站

(0)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • pandas实现to_sql将DataFrame保存到数据库中

    当我们使用pandas处理了数据后,常常需要将其保存至数据库中。下面是使用pandas的DataFrame将数据保存至MySQL数据库中的完整攻略。 准备工作 在进行以下操作之前,需要确保以下步骤已完成: 安装MySQL数据库,并创建一个数据库和一个数据表 安装pandas库和mysql-connector-python库 步骤一:创建连接对象 首先,我们需…

    python 2023年5月14日
    00
  • Pytorch 的损失函数Loss function使用详解

    Pytorch的损失函数Loss Function使用详解 在神经网络的模型训练过程中,损失函数是非常重要的一个组成部分。Pytorch作为一个深度学习框架,内置了许多常用的损失函数,可以快速地选择和使用。 1. Pytorch内置损失函数 在Pytorch中,常用的损失函数主要包括以下几种: nn.MSELoss: 均方误差损失函数,适合回归任务。 nn.…

    python 2023年5月14日
    00
  • 用Pandas进行分组和聚合

    Pandas是Python中一个强大的数据处理库,可以对各种形式的数据进行分组聚合。下面我们就详细讲解用Pandas进行分组和聚合。 分组(groupby) groupby是Pandas中常用的一个函数,用于按照一个或多个列的值进行分组。groupby函数返回一个分组对象,可以对其进行聚合操作。 按单个列分组 下面是一个例子,我们按照“城市”这一列进行分组:…

    python-answer 2023年3月27日
    00
  • 如何利用python实现词频统计功能

    首先,需要准备文本数据,可以从文件中读取或者从网页等其他渠道获取。接着,需要对文本进行分词处理,将文本拆分为单独的词语。最后,根据词语出现的频率进行统计和排序,得到每个词语出现的次数。 以下是基本的代码实现过程: 1. 读取文件数据 要使用python进行词频统计,首先需要准备好要统计的文本数据。我们可以从一个文件中读取数据: with open(‘file…

    python 2023年5月14日
    00
  • 对dataframe进行列相加,行相加的实例

    针对对DataFrame进行列相加和行相加,下面是详细的攻略: DataFrame列相加 DataFrame列相加实际上是针对DataFrame的列进行对应相加,例如: import pandas as pd # 创建DataFrame df = pd.DataFrame({‘A’: [1, 2, 3], ‘B’: [4, 5, 6], ‘C’: [7, 8…

    python 2023年6月13日
    00
  • python dataframe实现统计行列中零值的个数

    下面是详细的“Python dataframe实现统计行列中零值的个数”的攻略。 1. 什么是DataFrame DataFrame是pandas库中的一种数据结构,类似于Excel表格,可以存储不同类型的数据,并且可以对这些数据进行操作和分析。它由若干行和若干列组成,每一列代表一个特征,每一行代表一个样本。 2. DataFrame中统计行列中零值的个数 …

    python 2023年6月13日
    00
  • 在Pandas数据框架中用最新的正值替换负值

    在 Pandas 数据框架中,我们可以使用 where 函数来替换负数为最新的正值。下面是详细的步骤: 导入 Pandas 模块并读取数据 import pandas as pd data = pd.read_csv(‘data.csv’) 将数据框架中的负数替换为 NaN data = data.where(data >= 0) 该语句将数据框架 d…

    python-answer 2023年3月27日
    00
  • 使用Python在Pandas中进行数据分析

    Pandas是Python的一个数据分析工具,它可以很方便地进行数据读取、处理、分析和可视化等操作。下面我将详细讲解在Pandas中进行数据分析的步骤和常用的操作方法。 1. 数据的读取和处理 Pandas可以读取多种数据格式的文件,比如csv、excel、json等,其中最常用的是读取csv文件。下面是一个读取csv文件的例子: import pandas…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部