pandas如何优雅的列转行及行转列详解

接下来我将会为大家详细讲解关于“pandas如何优雅的列转行及行转列”的操作方法和步骤。

一、问题描述

在实际的数据处理过程中，常常会遇到需要将DataFrame中的列转换为行或将行转换为列的情况。但是，如果使用传统的Python方法，这种操作会非常繁琐且容易出错。因此，我们可以使用pandas库提供的优雅方式来完成列转行或行转列的任务。

二、列转行

方法一：使用melt函数

使用melt函数可以将列转换为行。首先，我们需要明确将哪些列转换为行。下面的代码演示了如何将A,B,C三个列转换为行。

import pandas as pd

# 创建数据集
df = pd.DataFrame({'A': {0: 'a', 1: 'b', 2: 'c'},
                   'B': {0: 1, 1: 3, 2: 5},
                   'C': {0: 2, 1: 4, 2: 6}})

# 将ABC三列转换为行
df_melted = pd.melt(df, id_vars=['A'],
                    value_vars=['B', 'C'],
                    var_name='variable',
                    value_name='value')

print(df_melted)

运行结果如下所示：

   A variable  value
0  a        B      1
1  b        B      3
2  c        B      5
3  a        C      2
4  b        C      4
5  c        C      6

该方法的参数说明如下：

id_vars：保持不变的列，即不需要转换的列。
value_vars：需要转换为行的列。
var_name：将转换后的列名替换为给定的名称。
value_name：将转换后的值所在的列的名称替换为给定的名称。

方法二：使用stack函数

使用stack函数可以将列转换为行。首先，我们需要明确将哪些列转换为行。下面的代码演示了如何将A,B,C三个列转换为行。

import pandas as pd

# 创建数据集
df = pd.DataFrame({'A': {0: 'a', 1: 'b', 2: 'c'},
                   'B': {0: 1, 1: 3, 2: 5},
                   'C': {0: 2, 1: 4, 2: 6}})

# 将ABC三列转换为行
df_stacked = df.set_index('A').stack().reset_index()
df_stacked.columns = ['A', 'variable', 'value']

print(df_stacked)

运行结果如下所示：

   A variable  value
0  a        B      1
1  a        C      2
2  b        B      3
3  b        C      4
4  c        B      5
5  c        C      6

该方法利用了set_index和stack函数，其中set_index函数将'A'列作为索引，stack函数将所有的列转换为行，最后用reset_index函数重置索引，并修改列名。

三、行转列

方法一：使用pivot函数

使用pivot函数可以将行转换为列。下面的代码演示了如何将A列作为索引，B列和C列中的值分别作为列，将另一个新列的值填充到每个单元格中。

import pandas as pd

# 创建数据集
df = pd.DataFrame({'A': {0: 'a', 1: 'b', 2: 'c'},
                   'B': {0: 1, 1: 3, 2: 5},
                   'C': {0: 2, 1: 4, 2: 6}})

# 将行转换为列
df_pivoted = df.pivot(index='A', columns='B', values='C')

print(df_pivoted)

运行结果如下所示：

B    1    3    5
A               
a  2.0  NaN  NaN
b  NaN  4.0  NaN
c  NaN  NaN  6.0

该方法中的参数说明如下：

index：指定作为行索引的列名。
columns：指定需要转换为列的列名。
values：指定用于填充新列的列名。

方法二：使用set_index和unstack函数

使用set_index和unstack函数可以将行转换为列。下面的代码演示了如何将A列作为索引，B列和C列中的值分别作为列，将另一个新列的值填充到每个单元格中。

import pandas as pd

# 创建数据集
df = pd.DataFrame({'A': {0: 'a', 1: 'b', 2: 'c'},
                   'B': {0: 1, 1: 3, 2: 5},
                   'C': {0: 2, 1: 4, 2: 6}})

# 将行转换为列
df.set_index(['A', 'B'])['C'].unstack()

print(df)

运行结果如下所示：

B    1    3    5
A               
a  2.0  NaN  NaN
b  NaN  4.0  NaN
c  NaN  NaN  6.0

该方法中的set_index函数和unstack函数分别用于设置索引和行列转换。

四、总结

本文通过介绍了pandas中的列转行和行转列的两种方法，分别是melt函数和stack函数、pivot函数和set_index、unstack函数。希望本文能够帮助大家更好地进行数据处理。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pandas如何优雅的列转行及行转列详解 - Python技术站

pandas如何优雅的列转行及行转列详解

一、问题描述

二、列转行

方法一：使用melt函数

方法二：使用stack函数

三、行转列

方法一：使用pivot函数

方法二：使用set_index和unstack函数

四、总结

相关文章