Pandas操作两个Excel实现数据对应行的合并

Pandas是Python中一个强大的数据处理库，我们可以使用它来完成相关的数据操作。下面我将详细讲解“Pandas操作两个Excel实现数据对应行的合并”的完整攻略，包括两条示例说明。

一、读取Excel文件

要实现数据对应行的合并，首先需要读取两个Excel文件的数据。我们可以使用pandas库的read_excel函数来实现，代码如下：

import pandas as pd

# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')

二、创建合并的关键列

接下来，我们需要确定数据对应的关键列，将两个Excel文件中具有相同值（或者唯一值）的列作为合并的关键列。假设第一个Excel文件中的关键列为“ID”，第二个Excel文件中的关键列为“编号”，代码如下：

# 创建关键列
key_column1 = 'ID'
key_column2 = '编号'

三、合并数据

合并数据过程比较简单，我们只需要使用pandas库的merge函数即可。我们需要指定合并的方式、关键列和左右两个数据集的列信息。假设我们希望保留第一个Excel文件中的所有列，并添加第二个Excel文件中的“价格”列，代码如下：

# 合并数据
merged_data = pd.merge(df1, df2[['编号', '价格']], how='left', left_on=key_column1, right_on=key_column2)

# 输出合并后的数据
print(merged_data)

以上代码中，我们使用了merge函数来合并两个数据集，参数如下：

df1：第一个数据集
df2[['编号', '价格']]：第二个数据集，只包含“编号”和“价格”两列
how='left'：采用左连接合并方式
left_on=key_column1：将第一个数据集中的“ID”列作为关键列
right_on=key_column2：将第二个数据集中的“编号”列作为关键列

合并后的结果将保存在merged_data变量中，我们通过调用print函数将其输出到控制台。

四、示例说明

以下是两个Excel文件的示例数据：

file1.xlsx

ID	姓名	年龄
1	张三	18
2	李四	20
3	王五	22

file2.xlsx

编号	价格
2	100
4	200

现在我们将以上代码整合到一个Python文件中，运行该文件，得到的结果如下：

import pandas as pd

# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')

# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')

# 创建关键列
key_column1 = 'ID'
key_column2 = '编号'

# 合并数据
merged_data = pd.merge(df1, df2[['编号', '价格']], how='left', left_on=key_column1, right_on=key_column2)

# 输出合并后的数据
print(merged_data)

输出结果：

   ID  姓名  年龄     编号     价格
0   1  张三   18    NaN    NaN
1   2  李四   20    2.0  100.0
2   3  王五   22    NaN    NaN

以上结果表示，通过第一个Excel文件中的“ID”列和第二个Excel文件中的“编号”列进行合并，合并方式为左连接，现在我们可以得到一个新的DataFrame，包含第一个Excel文件中的所有列，并且添加了第二个Excel文件中对应行的“价格”列。

五、总结

以上就是“Pandas操作两个Excel实现数据对应行的合并”的完整攻略。这个攻略中，我们先是使用read_excel函数读取了两个Excel文件的数据，然后创建了关键列，最后使用merge函数完成了数据的合并。我们通过一个示例说明了如何将两个Excel文件中的数据进行合并，希望可以帮助大家更好地应用Pandas库进行数据处理。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Pandas操作两个Excel实现数据对应行的合并 - Python技术站