Pandas是Python中用于数据处理和分析的强大工具,通过使用loc方法,可以生成新的列。下面是通过loc生成新的列方法的完整攻略:
步骤1: 导入pandas模块
首先需要导入pandas模块
import pandas as pd
步骤2: 创建DataFrame
接下来创建一个包含数据的DataFrame
data = {'name':['Tom', 'Jack', 'Steve', 'Ricky'],
'age':[28,34,29,42],
'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出结果:
name age gender
0 Tom 28 M
1 Jack 34 M
2 Steve 29 M
3 Ricky 42 M
步骤3:在DataFrame中使用loc方法生成新的列
通过使用loc方法,可以在DataFrame中生成新的列。下面是两个示例:
示例1:从已有列中生成新的列
df.loc[:, 'name_length'] = df['name'].apply(len)
print(df)
输出结果:
name age gender name_length
0 Tom 28 M 3
1 Jack 34 M 4
2 Steve 29 M 5
3 Ricky 42 M 5
从上面的输出结果可以看到,使用loc方法在DataFrame中生成了一个新的名为‘name_length'的列。其中name_length列的值是通过使用apply函数在'name'列上应用函数len来生成的。
示例2: 根据已有的列中的值生成新的列
df.loc[:, 'age_group'] = pd.cut(df.age, bins=[18, 30, 40, 50], labels=['young', 'middle-aged', 'old'])
print(df)
输出结果:
name age gender name_length age_group
0 Tom 28 M 3 young
1 Jack 34 M 4 middle-aged
2 Steve 29 M 5 young
3 Ricky 42 M 5 middle-aged
从上面的输出结果可以看到,使用loc方法在DataFrame中生成了一个新的名为‘age_group'的列。其中age_group列的值是通过pd.cut函数将age列中的值分成3个不同的区间,然后再进行标记生成的。
通过上面的示例,我们就可以使用loc方法在Pandas的DataFrame中生成新的列了。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas通过loc生成新的列方法 - Python技术站