以下是如何将一个目录下的所有excel文件读成Pandas DataFrame的具体步骤:
- 首先,需要导入Pandas库和os库,os库用于获取目录下所有文件的文件名。
python
import pandas as pd
import os
- 使用os库获取目录下所有excel文件的文件名,并将它们存储在一个列表里。
python
file_names = []
for file in os.listdir('path/to/directory'):
if file.endswith('.xlsx'):
file_names.append(file)
其中,'path/to/directory'是excel文件所在的目录的路径,可以根据实际情况进行更改。
- 使用Pandas库的read_excel函数读取每个excel文件,并将它们存储在一个列表里。
python
dfs = []
for file in file_names:
df = pd.read_excel('path/to/directory/' + file)
dfs.append(df)
这里使用了一个for循环,遍历了之前获取的所有excel文件的文件名,依次读取每个文件并将它们存储在dfs列表里。
- 最后,可以使用Pandas库的concat函数将dfs列表里的所有DataFrame合并成一个DataFrame,得到一个由所有Excel文件构成的大表格。
python
combined_df = pd.concat(dfs, ignore_index=True)
ignore_index=True
参数表示将所有的行索引重置为 0, 1, 2, ……。
整个过程就是这样,将所有Excel文件读入 Pandas DataFrame 后,我们就可以根据需要对它们进行操作和分析了。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何将一个目录下的所有excel文件读成Pandas DataFrame - Python技术站