Python 实现多表和工作簿合并及一表按列拆分

Python 实现多表和工作簿合并及一表按列拆分攻略

1. 合并多张表格

1.1. 读取并合并同一个文件夹下的所有表格

你可以通过 Pandas 库来实现对同一个文件夹下的所有表格进行读取和合并。

示例代码如下:

import pandas as pd
import glob

path = r'./path/to/folder/*.csv'

all_files = glob.glob(path)

li = []

for filename in all_files:
    df = pd.read_csv(filename, index_col=None, header=0)
    li.append(df)

frame = pd.concat(li, axis=0, ignore_index=True)

1.2. 合并两个不同的表格

对于两个不同的表格,可以使用 Pandas 的merge方法来实现合并。

示例代码如下:

import pandas as pd

df1 = pd.read_csv('./path/to/table1.csv')
df2 = pd.read_csv('./path/to/table2.csv')

merged_df = pd.merge(df1, df2, on='key')

其中,key指的是两个表格要合并的列。如果两个表格中的连接列名称不一致,可以使用left_onright_on参数进行指定。

2. 合并多个工作簿

2.1. 合并同一工作簿内的多个工作表

可以使用 Pandas 的ExcelFile方法来读取同一个工作簿内的多个工作表,并使用concat方法合并这些表。

示例代码如下:

import pandas as pd

excel_file = pd.ExcelFile('./path/to/workbook.xlsx')
dfs = []

for sheet_name in excel_file.sheet_names:
    df = excel_file.parse(sheet_name)
    dfs.append(df)

merged_df = pd.concat(dfs, ignore_index=True)

2.2. 合并不同工作簿内的同名工作表

可以使用 Pandas 的read_excel方法来读取多个工作簿内的同名工作表,并使用concat方法合并这些表。

示例代码如下:

import pandas as pd
import glob

path = r'./path/to/folder/*.xlsx'
sheet_name = 'Sheet1'

all_files = glob.glob(path)

li = []

for filename in all_files:
    df = pd.read_excel(filename, sheet_name=sheet_name)
    li.append(df)

merged_df = pd.concat(li, ignore_index=True)

3. 一表按列拆分

可以使用 Pandas 的melt方法来实现一表按列拆分。

示例代码如下:

import pandas as pd

df = pd.read_csv('./path/to/table.csv')
melted_df = pd.melt(df, id_vars=['id'], value_vars=['col1', 'col2'])

其中,id_vars指定保留的列,value_vars指定要拆分的列。

总结

Python 实现多表和工作簿合并及一表按列拆分的方法有很多,上面提到的只是其中几种常用的方法。希望可以对大家有所帮助。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python 实现多表和工作簿合并及一表按列拆分 - Python技术站

(0)
上一篇 2023年6月13日
下一篇 2023年6月13日

相关文章

  • 利用python爬取城市公交站点

    关于利用Python爬取城市公交站点的攻略,可以分为以下步骤: 寻找对应的数据源。可以在城市公交官网或者其他公开数据网站上找到公交线路和站点的信息。 分析网页结构。通过查看网页源代码和浏览器开发者工具,了解网页的结构和数据获取方式。 使用Python的requests库模拟发送请求,获取网页内容。 使用Python的BeautifulSoup库解析网页内容,…

    python 2023年6月13日
    00
  • python进行数据合并concat/merge

    接下来我将为您提供关于“Python进行数据合并concat/merge”的完整攻略。 什么是数据合并? 在数据分析中,数据往往是以不同的方式存储或分散在不同的文件或数据表中,这时候我们就需要将这些表或文件中的数据进行合并,以便更好地进行分析。数据合并通常指将两个或多个数据表中的数据按照一定的规则进行合并,组成完整的数据集。 concat与merge的区别 …

    python 2023年6月13日
    00
  • Pyinstaller加密打包应用的示例代码

    首先,需要说明一下Pyinstaller是一个Python的独立应用程序打包工具,支持将Python程序打包成Windows、Linux、Mac OS X、FreeBSD、Solaris和AIX平台上可执行的二进制文件。 接下来我将详细讲解“Pyinstaller加密打包应用的示例代码”的完整攻略。 下载安装Pyinstaller Pyinstaller是在…

    python 2023年6月13日
    00
  • Python实现从多表格中随机抽取数据

    下面是Python实现从多表格中随机抽取数据的完整攻略。 1. 准备工作 在实现从多个表格中随机抽取数据之前,我们需要先准备好数据。具体来说,我们需要将多个数据表格整合为一个数据集,以便之后的处理。 下面以两个表格作为示例来说明准备工作的具体步骤: 1.1 下载示例数据集 假设我们有两个数据表格,一个包含了名人的信息,另一个包含了他们的名言警句。 我们可以从…

    python 2023年6月13日
    00
  • pyecharts的Tab和Legend布局详情

    pyecharts是一个非常强大的Python可视化工具库,支持多种图表类型和多种布局方式,其中包括Tab和Legend布局,下面我将详细讲解它们的使用方法和示例说明。 Tab布局 Tab布局是pyecharts中的一种常见布局方式,可以将多种不同类型的图表放在同一个页面中,以Tab切换的形式进行展示。以下是使用Tab布局的完整攻略: 实现步骤 导入Tab和…

    python 2023年6月13日
    00
  • pandas 实现将两列中的较大值组成新的一列

    要实现将两列中的较大值组成新的一列,我们可以使用 pandas 库中的 dataframe,通过一些简单的操作实现。以下是实现步骤: 步骤一:导入 pandas 库 首先执行我们需要使用 pandas 库,可以通过以下代码导入: import pandas as pd 步骤二:读取需要处理的数据 读取源数据与其他用 pandas 处理的一样。可以使用 pd.…

    python 2023年6月13日
    00
  • Python DataFrame一列拆成多列以及一行拆成多行

    对于Python中的DataFrame,有时候我们需要将一列数据拆分成多列,或者将一行数据拆成多行,这在数据清洗和处理过程中十分常见。下面就是详细讲解“Python DataFrame一列拆成多列以及一行拆成多行”的完整攻略。 一列拆成多列 方法一:使用split函数 在DataFrame中,我们可以使用Pandas库提供的split函数实现将一列数据按照指…

    python 2023年6月13日
    00
合作推广
合作推广
分享本页
返回顶部