在Pandas数据框架中添加新的变量

2023年3月27日下午3:00 • python-answer

在Pandas数据框架中添加新的变量可以通过以下方法：

使用现有变量创建新变量：

可以通过对现有变量的操作得到新的变量，例如：将字符串变量转换为数字变量，对数字变量进行计算等等。

示例代码：

import pandas as pd

# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚', '小刚', '小明', '小红'],
        '语文': [90, 80, 88, 70, 95, 87],
        '英语': [95, 82, 85, 68, 90, 80]}
df = pd.DataFrame(data)

# 新增总分变量
df['总分'] = df['语文'] + df['英语']

print(df)

输出结果：

   姓名  语文  英语   总分
0  小明  90  95  185
1  小红  80  82  162
2  小刚  88  85  173
3  小刚  70  68  138
4  小明  95  90  185
5  小红  87  80  167

使用函数创建新变量：

可以使用自定义函数或Pandas内置函数创建新的变量，例如：使用apply()方法或map()方法，对数据集中的每个值进行操作。

示例代码：

import pandas as pd

# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚'],
        '语文': [90, 80, 88],
        '英语': [95, 82, 85]}
df = pd.DataFrame(data)

# 自定义函数
def add_score(x):
    return x + 5

# 使用apply()方法增加语文和英语的成绩
df['语文加分'] = df['语文'].apply(add_score)
df['英语加分'] = df['英语'].apply(add_score)

# 使用map()方法修改姓名
df['姓名'] = df['姓名'].map(lambda x: '学生'+x)

print(df)

输出结果：

     姓名  语文  英语  语文加分  英语加分
0  学生小明  90  95     95    100
1  学生小红  80  82     85     87
2  学生小刚  88  85     93     90

使用assign()方法创建新变量：

可以使用assign()方法来创建新的变量，并且可以一次性创建多个新的变量。

示例代码：

import pandas as pd

# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚'],
        '语文': [90, 80, 88],
        '英语': [95, 82, 85]}
df = pd.DataFrame(data)

# 使用assign()方法增加语文和英语的加分变量
df = df.assign(语文加分=df['语文']+5, 英语加分=df['英语']+5)

print(df)

输出结果：

   姓名  语文  英语  语文加分  英语加分
0  小明  90  95     95    100
1  小红  80  82     85     87
2  小刚  88  85     93     90

总结：

在Pandas数据框架中添加新变量的方法有很多，我们可以根据实际需求和数据格式选择适合的方法，以便更方便地进行数据分析和处理。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：在Pandas数据框架中添加新的变量 - Python技术站

在Pandas数据框架中添加新的变量

相关文章