当我们需要整合多个csv文件时,可以利用Python中pandas库的concat函数进行合并。
下面是完整攻略:
1. 安装pandas库
在终端输入以下命令安装:
pip install pandas
2. 导入pandas库
在Python文件中导入pandas库:
import pandas as pd
3. 读取csv文件并合并
以下是两个待合并的文件,都包含Name
和Age
两列:
file1.csv
Name,Age
Lucy,18
Tom,21
file2.csv
Name,Age
John,24
Mary,19
我们可以通过使用pd.concat()
函数来合并这两个文件:
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df = pd.concat([df1, df2])
代码中,pd.read_csv()
函数用于读取csv文件,将它们存储在DataFrame类型的变量中。最后一行代码使用pd.concat()
函数将这两个数据框沿着行方向合并在一起,得到一个新的DataFrame:df
。
4. 保存合并后的csv文件
我们可以用以下代码将合并后的数据存储到新的csv文件中:
df.to_csv('merged_file.csv', index=False)
此处使用to_csv()
函数将合并后的csv保存到本地,index=False
参数表示我们不需要保存自动生成的索引。
以上就是利用Python合并csv文件的完整攻略。下面是两个操作实例:
实例1. 合并多个csv文件
除上面提到的两个文件之外,还有file3.csv
和file4.csv
,都包含Name
和Age
两列。那么我们可以使用以下代码将它们合并:
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df3 = pd.read_csv('file3.csv')
df4 = pd.read_csv('file4.csv')
df_merged = pd.concat([df1, df2, df3, df4])
df_merged.to_csv('merged_file.csv', index=False)
实例2. 合并csv文件并指定列
除了Name
和Age
两列,这个时候我们还有Gender
和City
两列需要合并。我们可以使用以下代码指定需要合并的列:
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
df_merged = pd.concat([df1[['Name', 'Age', 'Gender']], df2[['Name', 'Age', 'City']]], sort=False)
df_merged.to_csv('merged_file.csv', index=False)
代码中,[['Name', 'Age', 'Gender']]
和[['Name', 'Age', 'City']]
分别表示需要合并的列。使用sort=False
参数可以禁用自动排序。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:利用python合并csv文件的方式实例 - Python技术站