在 Pandas 中读取一个文件夹中的所有 CSV 文件可以采用以下步骤:
- 首先导入 Pandas 库
import pandas as pd
- 通过
os
库或者glob
库获取整个文件夹中的 CSV 文件名列表。os
库提供了一个listdir
函数,可以获取文件夹中所有文件的文件名列表,而glob
库则可以更加方便地使用通配符获取符合条件的文件名列表。
下面是使用 os
库获取 CSV 文件名列表的示例:
import os
folder_path = "/path/to/folder" # 替换为实际文件夹路径
csv_files = [f for f in os.listdir(folder_path) if f.endswith('.csv')]
使用 glob
库的示例:
import glob
folder_path = "/path/to/folder" # 替换为实际文件夹路径
csv_files = glob.glob(folder_path + "/*.csv")
- 循环遍历 CSV 文件名列表,使用 Pandas 的
read_csv
函数读取每个 CSV 文件,并将其合并成一个 Pandas DataFrame。
下面是示例代码:
folder_path = "/path/to/folder" # 替换为实际文件夹路径
csv_files = glob.glob(folder_path + "/*.csv")
dfs = []
for csv_file in csv_files:
df = pd.read_csv(csv_file)
dfs.append(df)
merged_df = pd.concat(dfs, ignore_index=True)
在上述示例代码中,每次循环使用 pd.read_csv()
函数读取一个 CSV 文件,并将读取的 DataFrame 对象存入列表 dfs
中。最后使用 pd.concat()
函数将所有 DataFrame 对象合并成一个完整的 DataFrame 对象,并使用 ignore_index=True
参数重新编号所有行。
这样,我们就可以在 Pandas 中轻松地读取一个文件夹中的所有 CSV 文件了。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Pandas中读取一个文件夹中的所有CSV文件 - Python技术站