如何将一个目录下的所有excel文件读成Pandas DataFrame

2023年3月27日下午12:03 • python-answer

首先，我们需要导入pandas和os模块：

import pandas as pd
import os

接下来，我们可以使用os模块中的listdir()函数列出目标目录下的所有文件：

file_list = os.listdir('path/to/directory')

其中，path/to/directory是目标目录的路径。请确保路径格式正确，并将路径中的反斜杠\改为正斜杠/。

然后，我们可以使用一个for循环遍历所有的文件，通过pandas中的read_excel()函数将文件读入DataFrame，并使用append()函数将它们存储在一个list中：

data_frames = []

for file_name in file_list:
    if file_name.endswith('.xlsx'):
        full_path = os.path.join('path/to/directory', file_name)
        data_frames.append(pd.read_excel(full_path))

其中，os.path.join()函数是用来拼接目录路径和文件名的。请将path/to/directory替换为目标目录的路径。

最后，我们可以使用pd.concat()函数将所有的DataFrame连接起来：

df = pd.concat(data_frames, ignore_index=True)

其中的ignore_index=True选项可以忽略原DataFrame中的索引，并重新为新的DataFrame生成序号。

完整代码如下：

import pandas as pd
import os

file_list = os.listdir('path/to/directory')
data_frames = []

for file_name in file_list:
    if file_name.endswith('.xlsx'):
        full_path = os.path.join('path/to/directory', file_name)
        data_frames.append(pd.read_excel(full_path))

df = pd.concat(data_frames, ignore_index=True)

请确保路径正确，并将其复制粘贴到你的Python脚本中即可。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何将一个目录下的所有excel文件读成Pandas DataFrame - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

如何修复：TypeError: no numeric data to plot

上一篇 2023年3月27日

如何在Python中进行邓恩氏检验

下一篇 2023年3月27日

使用Django框架在表格视图中把数据框架渲染成html模板

下面就为您详细讲解如何使用Django框架在表格视图中把数据框架渲染成HTML模板。首先创建一个Django项目，并安装必要的依赖。在项目目录下创建一个名为“views.py”的文件，用于编写表格视图的代码。在views.py中导入必要的模块： from django.shortcuts import render from django.views.g…

python-answer 2023年3月27日
000
在Python中使用Pandas替换缺失值

Pandas是Python中用于处理数据的一个库。在数据分析和数据清洗中，经常会遇到缺失值的情况。Pandas中提供了一些方法来替换缺失值。 Pandas中的缺失值表示 Pandas中的缺失值有两种表示方式：NaN和None。其中，NaN是Not a Number的缩写，它是一个浮点数，表示一个在算术运算中不合法的结果。而None是Python中的一个特殊对…

python-answer 2023年3月27日
000
如何修复：module ‘pandas’ has no attribute ‘dataframe’

首先，需要明确的是 “module ‘pandas’ has no attribute ‘dataframe’” 这个错误提示的意思是：Pandas 模块中没有名为 “dataframe” 的属性或方法。下面是修复该错误的可能方法： 1.检查拼写错误在代码中查找是否存在 “pandas.dataframe” 的拼写错误，可以通过检查大小写，拼写和空格来确…

python-answer 2023年3月27日
000
Pandas GroupBy

下面我会详细讲解Pandas的GroupBy功能。 GroupBy的基本概念和用法在Pandas中，GroupBy是一个强大和灵活的功能，它的作用是将数据按某个特定的标准分组，并在每个组中执行特定的操作。例如，假设我们有一个简单的数据集，其中包含城市、天气和温度的信息： import pandas as pd data = { ‘city’: [‘Bei…

python-answer 2023年3月27日
000
如何使用Python Pandas将excel文件导入

使用Python Pandas将excel文件导入的步骤如下：导入必要的库使用pandas进行excel文件读取之前，需要先导入pandas和xlrd库。代码如下： import pandas as pd import xlrd 使用pandas进行excel文件读取使用pandas的read_excel函数可以轻松读取Excel文件。请注意，必须指定…

python-answer 2023年3月27日
000
Python与Pandas和XlsxWriter组合工作 – 2

继续回答“详细讲解Python与Pandas和XlsxWriter组合工作”的第二部分。在使用Pandas和XlsxWriter生成Excel文件之前，我们需要先安装它们。在命令行中运行如下指令即可： pip install pandas pip install xlsxwriter 接下来，我们需要创建一个Pandas数据帧，并将其写入Excel文件中。…

python-answer 2023年3月27日
000
使用Python检测和删除异常值

下面是详细讲解使用Python检测和删除异常值的步骤。首先，导入必要的库使用Python处理异常值，需要导入以下库： import numpy as np import pandas as pd from scipy import stats import matplotlib.pyplot as plt numpy：用于矩阵运算和统计计算。 panda…

python-answer 2023年3月27日
000
Pandas-两列的所有组合

Pandas是一个用于数据处理和数据分析的Python库。对于两列的所有组合，我们可以使用Pandas的merge()和concat()方法来实现。首先，我们需要用Pandas加载两列数据，这可以使用read_csv()方法来实现。假设我们有两列数据，分别为col1和col2，首先我们可以使用以下代码来加载这些数据： import pandas as pd…

python-answer 2023年3月27日
000

合作推广

合作推广

返回顶部