我来为您详细讲解一下“pandas选择或添加列生成新的DataFrame操作示例”的完整攻略,具体步骤如下:
1. 选择列
在pandas中,要选择一列数据可以使用 DataFrame[column_name] 或者 DataFrame.column_name 的方式。
例如,我们有如下一个DataFrame:
import pandas as pd
df = pd.DataFrame({
'A': [1,2,3,4,5],
'B': ['a', 'b', 'c', 'd', 'e'],
})
print(df)
输出:
A B
0 1 a
1 2 b
2 3 c
3 4 d
4 5 e
我们可以通过以下方式选择'A'列:
a = df['A']
print(a)
输出:
0 1
1 2
2 3
3 4
4 5
Name: A, dtype: int64
同样,我们也可以使用 DataFrame.A 的方式选择'A'列:
a = df.A
print(a)
输出:
0 1
1 2
2 3
3 4
4 5
Name: A, dtype: int64
2. 添加列
要添加一列数据可以使用 DataFrame[column_name] 或者 DataFrame.column_name 的方式。
例如,在上面的例子中,我们想要添加一列'C',并将它的值设为'A'列和'B'列的和,可以使用以下代码:
df['C'] = df['A'] + df['B']
print(df)
输出:
A B C
0 1 a 1a
1 2 b 2b
2 3 c 3c
3 4 d 4d
4 5 e 5e
其中,df['C'] 表示添加一列名为'C'的列,其值为 df['A'] + df['B']。
3. 示例
下面,我们再给出一个具体的示例,以供参考。
假设我们有一个数据集 data.csv,它包含了一些人的年龄(age)、身高(height)和性别(gender):
age,height,gender
18,170,M
20,175,F
19,168,M
22,182,M
24,168,F
我们可以使用 pandas 将其读入为一个 DataFrame:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
输出:
age height gender
0 18 170 M
1 20 175 F
2 19 168 M
3 22 182 M
4 24 168 F
接下来,我们想要添加一列 weight,其值为 height-100,可以使用以下代码:
df['weight'] = df['height'] - 100
print(df)
输出:
age height gender weight
0 18 170 M 70
1 20 175 F 75
2 19 168 M 68
3 22 182 M 82
4 24 168 F 68
可以看到,我们成功添加了一列 weight,并计算了它的值。
这就是关于“pandas选择或添加列生成新的DataFrame操作示例”的完整攻略,希望能对您有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas选择或添加列生成新的DataFrame操作示例 - Python技术站