让我来为你详细讲解“Python数据分析之 Pandas Dataframe合并和去重操作”的完整攻略。
Pandas Dataframe合并操作
1. concat函数
使用 concat
函数可以将两个或多个DataFrame
对象按行或列连接成一个数据集。
按行连接
import pandas as pd
# 创建两个dataframe对象
df1 = pd.DataFrame({'name': ['John', 'Anna', 'Peter'], 'age': [25, 36, 48]})
df2 = pd.DataFrame({'name': ['Mary', 'Tom'], 'age': [31, 52]})
# 使用concat函数按行连接两个dataframe对象
result = pd.concat([df1, df2])
print(result)
输出结果为:
name age
0 John 25
1 Anna 36
2 Peter 48
0 Mary 31
1 Tom 52
按列连接
import pandas as pd
# 创建两个dataframe对象
df1 = pd.DataFrame({'name': ['John', 'Anna', 'Peter'], 'age': [25, 36, 48]})
df2 = pd.DataFrame({'gender': ['Male', 'Female'], 'height': [170, 165]})
# 使用concat函数按列连接两个dataframe对象
result = pd.concat([df1, df2], axis=1)
print(result)
输出结果为:
name age gender height
0 John 25 Male 170
1 Anna 36 Female 165
2 Peter 48 NaN NaN
2. merge函数
使用 merge
函数可以将两个DataFrame
对象按照某列进行合并数据。
import pandas as pd
# 创建两个dataframe对象
df1 = pd.DataFrame({'name': ['John', 'Anna', 'Peter'], 'age': [25, 36, 48]})
df2 = pd.DataFrame({'name': ['Anna', 'Tom'], 'score': [80, 100]})
# 使用merge函数按照name列进行数据合并
result = pd.merge(df1, df2, on='name')
print(result)
输出结果为:
name age score
0 Anna 36 80
Pandas Dataframe去重操作
使用 drop_duplicates
函数可以删除数据集中的重复项。
import pandas as pd
# 创建一个有重复数据的dataframe对象
df = pd.DataFrame({'name': ['John', 'Anna', 'John', 'Tom'], 'age': [25, 36, 25, 52]})
# 使用drop_duplicates函数删除重复项
result = df.drop_duplicates()
print(result)
输出结果为:
name age
0 John 25
1 Anna 36
3 Tom 52
以上就是Python数据分析之 Pandas Dataframe合并和去重操作的完整攻略,希望能够帮助到你。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python数据分析之 Pandas Dataframe合并和去重操作 - Python技术站