首先,我们需要导入pandas
和os
模块:
import pandas as pd
import os
接下来,我们可以使用os
模块中的listdir()
函数列出目标目录下的所有文件:
file_list = os.listdir('path/to/directory')
其中,path/to/directory
是目标目录的路径。请确保路径格式正确,并将路径中的反斜杠\
改为正斜杠/
。
然后,我们可以使用一个for
循环遍历所有的文件,通过pandas
中的read_excel()
函数将文件读入DataFrame,并使用append()
函数将它们存储在一个list中:
data_frames = []
for file_name in file_list:
if file_name.endswith('.xlsx'):
full_path = os.path.join('path/to/directory', file_name)
data_frames.append(pd.read_excel(full_path))
其中,os.path.join()
函数是用来拼接目录路径和文件名的。请将path/to/directory
替换为目标目录的路径。
最后,我们可以使用pd.concat()
函数将所有的DataFrame连接起来:
df = pd.concat(data_frames, ignore_index=True)
其中的ignore_index=True
选项可以忽略原DataFrame中的索引,并重新为新的DataFrame生成序号。
完整代码如下:
import pandas as pd
import os
file_list = os.listdir('path/to/directory')
data_frames = []
for file_name in file_list:
if file_name.endswith('.xlsx'):
full_path = os.path.join('path/to/directory', file_name)
data_frames.append(pd.read_excel(full_path))
df = pd.concat(data_frames, ignore_index=True)
请确保路径正确,并将其复制粘贴到你的Python脚本中即可。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何将一个目录下的所有excel文件读成Pandas DataFrame - Python技术站