下面是Python中pandas.DataFrame的简单操作方法的攻略,包括创建、索引、增添与删除。
创建DataFrame
在Python中,我们可以使用Pandas库中的DataFrame类来创建数据表格。创建DataFrame通常可以从以下方式开始:
import pandas as pd
# 通过字典创建DataFrame,键为列名,值为列数据
data = { 'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
输出结果:
name age gender
0 Alice 25 F
1 Bob 30 M
2 Charlie 35 M
这里我们通过字典的方式,传入每个列的数据(即每个键的值),然后使用pd.DataFrame()方法创建DataFrame对象。
另外,也可以从csv、excel等文件中读取数据,或者手动创建空的DataFrame对象:
# 从csv文件中读取数据
df = pd.read_csv('data.csv')
# 从excel文件中读取数据
df = pd.read_excel('data.xlsx')
# 创建空的DataFrame对象
df = pd.DataFrame()
访问DataFrame
我们可以使用iloc()方法,按照列索引和行索引来访问DataFrame中的元素,同时也可以使用列名来访问DataFrame中的元素。
示例1:使用元素索引来访问DataFrame中的元素
# 访问Alice的年龄
print(df.iloc[0, 1])
输出结果:
25
示例2:使用列名来访问DataFrame中的元素
# 访问data中name列的值
print(df['name'])
# 访问data中的第一列数据
print(df[df.columns[0]])
输出结果:
0 Alice
1 Bob
2 Charlie
Name: name, dtype: object
0 Alice
1 Bob
2 Charlie
Name: name, dtype: object
更新DataFrame
我们先在DataFrame中添加一列数据,然后对其进行修改。
# 添加新的一列数据
df['email'] = ['alice@example.com', 'bob@example.com', 'charlie@example.com']
print(df)
# 修改Alice的内容
df.iloc[0, 1] = 26
print(df)
输出结果:
name age gender email
0 Alice 25 F alice@example.com
1 Bob 30 M bob@example.com
2 Charlie 35 M charlie@example.com
name age gender email
0 Alice 26 F alice@example.com
1 Bob 30 M bob@example.com
2 Charlie 35 M charlie@example.com
我们创建了新的email列,并且通过iloc()方法更新了Alice的年龄。
删除DataFrame
我们可以使用drop()方法来删除DataFrame的行或列。需要给出要删除的行或列的索引或名称,设置axis = 0表示删除行,axis = 1表示删除列。
示例1:删除email列
# 删除email列
df = df.drop(['email'], axis=1)
print(df)
输出结果:
name age gender
0 Alice 26 F
1 Bob 30 M
2 Charlie 35 M
示例2:删除第2行数据
# 删除第2行数据
df = df.drop(index=1)
print(df)
输出结果:
name age gender
0 Alice 26 F
2 Charlie 35 M
以上就是Python中pandas.DataFrame的简单操作方法的完整攻略,希望对你有所帮助!
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中pandas.DataFrame的简单操作方法(创建、索引、增添与删除) - Python技术站