将多个CSV文件合并到一个Pandas数据框中可以分为以下几个步骤:
- 导入 Pandas 模块:
import pandas as pd
- 读取所有 CSV 文件并将它们存储在一个列表中:
csv_files = ['file1.csv', 'file2.csv', 'file3.csv']
dfs = []
for csv in csv_files:
df = pd.read_csv(csv)
dfs.append(df)
- 使用
concat
函数将所有 DataFrame 合并成一个:
merged_df = pd.concat(dfs, ignore_index=True)
这里使用 ignore_index=True
可以确保合并后的数据框的行索引从 0 开始递增。如果不将其设置为 True
,则将保留所有原始的行索引。
完整代码示例:
import pandas as pd
csv_files = ['file1.csv', 'file2.csv', 'file3.csv']
dfs = []
for csv in csv_files:
df = pd.read_csv(csv)
dfs.append(df)
merged_df = pd.concat(dfs, ignore_index=True)
需要注意的是,如果这些CSV文件在数据结构上不完全一致,那么需要进行一些额外的处理,以确保所有列都对齐。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何将多个CSV文件合并到一个Pandas数据框中 - Python技术站