在Pandas数据框架中添加新的变量可以通过以下方法:
- 使用现有变量创建新变量:
可以通过对现有变量的操作得到新的变量,例如:将字符串变量转换为数字变量,对数字变量进行计算等等。
示例代码:
import pandas as pd
# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚', '小刚', '小明', '小红'],
'语文': [90, 80, 88, 70, 95, 87],
'英语': [95, 82, 85, 68, 90, 80]}
df = pd.DataFrame(data)
# 新增总分变量
df['总分'] = df['语文'] + df['英语']
print(df)
输出结果:
姓名 语文 英语 总分
0 小明 90 95 185
1 小红 80 82 162
2 小刚 88 85 173
3 小刚 70 68 138
4 小明 95 90 185
5 小红 87 80 167
- 使用函数创建新变量:
可以使用自定义函数或Pandas内置函数创建新的变量,例如:使用apply()方法或map()方法,对数据集中的每个值进行操作。
示例代码:
import pandas as pd
# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚'],
'语文': [90, 80, 88],
'英语': [95, 82, 85]}
df = pd.DataFrame(data)
# 自定义函数
def add_score(x):
return x + 5
# 使用apply()方法增加语文和英语的成绩
df['语文加分'] = df['语文'].apply(add_score)
df['英语加分'] = df['英语'].apply(add_score)
# 使用map()方法修改姓名
df['姓名'] = df['姓名'].map(lambda x: '学生'+x)
print(df)
输出结果:
姓名 语文 英语 语文加分 英语加分
0 学生小明 90 95 95 100
1 学生小红 80 82 85 87
2 学生小刚 88 85 93 90
- 使用assign()方法创建新变量:
可以使用assign()方法来创建新的变量,并且可以一次性创建多个新的变量。
示例代码:
import pandas as pd
# 创建测试数据
data = {'姓名': ['小明', '小红', '小刚'],
'语文': [90, 80, 88],
'英语': [95, 82, 85]}
df = pd.DataFrame(data)
# 使用assign()方法增加语文和英语的加分变量
df = df.assign(语文加分=df['语文']+5, 英语加分=df['英语']+5)
print(df)
输出结果:
姓名 语文 英语 语文加分 英语加分
0 小明 90 95 95 100
1 小红 80 82 85 87
2 小刚 88 85 93 90
总结:
在Pandas数据框架中添加新变量的方法有很多,我们可以根据实际需求和数据格式选择适合的方法,以便更方便地进行数据分析和处理。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas数据框架中添加新的变量 - Python技术站