要合并两个Pandas数据框架(dataframe),需要使用Pandas库中的merge函数。这个函数可以根据指定的列将两个数据框架合并为一个。以下是合并数据框架的详细步骤。
准备数据
首先,我们准备两个数据框架,每个数据框架都有一列用作索引(index),而且这两个数据框架包含的索引值有重叠。
import pandas as pd
# 准备第一个数据框架
data1 = {'index': [1, 2, 3, 4],
'data1': ['a', 'b', 'c', 'd']}
df1 = pd.DataFrame(data1)
df1 = df1.set_index('index')
# 准备第二个数据框架
data2 = {'index': [3, 4, 5, 6],
'data2': ['e', 'f', 'g', 'h']}
df2 = pd.DataFrame(data2)
df2 = df2.set_index('index')
现在,我们有了两个数据框架df1和df2,每个数据框架都有一列作为索引,两个数据框架的索引值有重叠。
合并数据
我们将使用merge函数合并两个数据框架。merge函数将两个数据框架连接在一起,必须指定要连接的索引列的名称。在本例中,我们将使用‘index’列来连接这两个数据框架。
merged_df = pd.merge(df1, df2, on='index', how='inner')
print(merged_df)
在上面的代码中,我们使用了merge函数合并了df1和df2,指定了要连接的索引列的名称为‘index’,how='inner'表示进行内部连接,即只包括重叠的索引值。合并后的结果将保存在merged_df变量中,我们使用print函数输出merged_df的结果,如下所示:
data1 data2
index
3 c e
4 d f
可以看到,它只包含了索引值为3和4的两行数据,这是因为这两个索引值是两个数据框架共有的。data1和data2分别是原始数据框架df1和df2的列名。
结论
在本教程中,我们学习了如何使用merge函数将两个Pandas数据框架合并为一个。它需要指定要连接的索引列名,可以使用inner、outer、left或right连接类型。merge函数非常灵活,允许在合并数据框架时进行更多的控制,可以更好地满足不同的需求。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在索引上合并两个Pandas数据框架 - Python技术站