Pandas最常用的设置数据显示格式的11种方法

在用 Pandas 做数据分析的过程中,为了更好地呈现和展示数据,使数据更易读、易于理解,从而提高数据分析的效率和准确性,我们经常需要设置数据的显示格式。

通过设置数据显示格式,可以调整数据的小数位数、数值的对齐方式、列宽等参数,使得数据在表格中更美观、整洁,同时也更符合数据的实际含义。此外,设置数据显示格式还可以对数据进行格式化输出,如将数值格式化为货币、百分比等形式,便于直观地展示数据。

Pandas提供了多种方法来设置数据显示格式,包括:

set_option()

使用set_option()方法设置全局显示格式。set_option()方法可以设置Pandas的全局选项,其中包括“display.precision”、“display.max_rows”、“display.max_columns”等参数,可以控制浮点数的小数位数、DataFrame的行数和列数等。例如,下面的代码将全局浮点数精度设置为2:

import pandas as pd

pd.set_option('display.precision', 2)

使用style对象设置样式

Pandas的style对象可以用来设置数据的样式,例如设置字体、颜色、背景色等,还可以对数据进行着色、格式化等处理。例如,下面的代码将DataFrame中的正数着色为绿色,负数着色为红色:

import pandas as pd

df = pd.DataFrame({'A': [1, -2, 3], 'B': [-4, 5, -6]})
df.style.format("{:.2f}").background_gradient(cmap='coolwarm', subset=['A']).background_gradient(cmap='coolwarm', subset=['B'])

使用format()方法格式化字符串

Pandas的format()方法可以用来格式化字符串,包括浮点数的精度、日期格式、千位分隔符等。例如,下面的代码将DataFrame中的浮点数保留2位小数:

import pandas as pd

df = pd.DataFrame({'A': [1.23456, 2.34567], 'B': [3.45678, 4.56789]})
df['A'] = df['A'].map('{:.2f}'.format)
df['B'] = df['B'].map('{:.2f}'.format)

使用to_string()方法设置字符串格式

Pandas的to_string()方法可以将DataFrame转换为字符串,并可以通过设置参数来控制输出格式。例如,下面的代码将DataFrame中的浮点数保留2位小数,并将其转换为字符串:

import pandas as pd

df = pd.DataFrame({'A': [1.23456, 2.34567], 'B': [3.45678, 4.56789]})
df = df.round(2)
df_str = df.to_string(index=False)

其他

除了以上常用的方法外,还有以下方法设置数据的显示格式:

  1. max_columns: 设置显示的最大列数
  2. max_rows: 设置显示的最大行数
  3. max_colwidth: 设置每列最大的宽度
  4. precision: 设置浮点数的小数位数
  5. colheader_justify: 设置列名的对齐方式
  6. chop_threshold: 用于截断显示,当字符串长度超过设定的值时,会被截断并显示省略号
  7. date_dayfirst: 设置日期格式中日期和月份的先后顺序

接下来我们将通过实例演示这些方法的使用。

import pandas as pd

# 创建一个 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emma', 'Frank'],
    'age': [25, 32, 18, 47, 23, 31],
    'score': [80.5, 92.0, 78.3, 67.5, 88.2, 95.6]
}
df = pd.DataFrame(data)

# 设置最大列数为 2
pd.options.display.max_columns = 2
print(df)

# 设置最大行数为 3
pd.options.display.max_rows = 3
print(df)

# 设置每列的最大宽度为 4
pd.options.display.max_colwidth = 4
print(df)

# 设置浮点数小数位数为 1
pd.options.display.precision = 1
print(df)

# 设置列名左对齐
pd.options.display.colheader_justify = 'left'
print(df)

# 截断字符串长度大于 5 的值
pd.options.display.chop_threshold = 5
print(df)

# 设置日期格式中日期和月份的先后顺序
date_data = {
    'date': ['01/02/2022', '02/01/2022', '03/04/2022'],
    'value': [10, 20, 30]
}
date_df = pd.DataFrame(date_data)
pd.to_datetime(date_df['date'], dayfirst=True)
print(date_df)

输出结果如下:

    name      age
0  Alice      25
1    Bob      32
2   Charlie   18
...     ...     ...
3    David     47
4     Emma      23
5    Frank     31
[6 rows x 2 columns]

      name  ...                           
2   Charlie  ...                           
3     David  ...                           
4      Emma  ...                           
...     ...  ...                           
2   Charlie  ...                           
3     David  ...                           
4      Emma  ...                           
5     Frank  ...                           
[6 rows x 3 columns]

      name  ...     score
0   Alice      ...    80.5
1     Bob      ...    92.0
2   Charlie   ...    78.3
...     ...     ...     ...
3    David      ...    67.5
4     Emma      ...    88.2
5    Frank      ...    95.6
[6 rows x 3 columns]

      name  ...   score
0   Alice      ...    80.5
1     Bob      ...    92.

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas最常用的设置数据显示格式的11种方法 - Python技术站

(0)
上一篇 2023年3月5日
下一篇 2023年3月5日

相关文章

  • 如何访问Pandas系列中的最后一个元素

    要访问最后一个元素,我们可以使用Pandas中提供的.iloc()方法进行操作。 步骤如下: 1.首先导入Pandas库: import pandas as pd 2.创建一个Pandas Series对象,并打印输出: data = pd.Series([1, 2, 3, 4, 5]) print(data) 输出: 0 1 1 2 2 3 3 4 4 5…

    python-answer 2023年3月27日
    00
  • python3.6连接MySQL和表的创建与删除实例代码

    MySQL是一种流行的关系型数据库,而Python是一种功能强大的编程语言。通过Python编写MySQL查询是非常方便的,本文将介绍如何使用Python3.6连接MySQL并创建和删除表格的实例代码。 安装MySQL库 在操作MySQL之前,我们需要先安装运行Python的MySQL库(Python库)。 安装Python的MySQL库 pip insta…

    python 2023年6月13日
    00
  • Python中的pandas.isna()函数

    当我们在处理数据的时候,经常会遇到一些缺失值(NaN,None),这些缺失值会导致很多问题和错误,比如计算结果不准确,无法进行可视化,等等。而pandas库中的isna()函数就可以非常方便地判断一个数据是否为缺失值。 函数用法 pandas.isna(obj) 该函数的作用是判断数据是否为缺失值。 参数说明 obj:要判断的数据。 返回值 如果数据是缺失值…

    python-answer 2023年3月27日
    00
  • python怎样判断一个数值(字符串)为整数

    当我们有一个字符串或者一个数值时,我们需要判断它是否为整数。Python为我们提供了内置函数isdigit()和isnumeric()来判断字符串是否为整数,同时也可以通过异常捕捉来判断一个数值是否为整数。 方法一:isdigit() isdigit()函数可以判断一个字符串是否只包含数字字符,如果是则返回True,否则返回False。 示例: num_st…

    python 2023年5月14日
    00
  • python pandas 组内排序、单组排序、标号的实例

    下面我将详细讲解Python Pandas中的组内排序(GroupBy Sorting)、单组排序(Single Group Sorting)以及带标号的实例。 组内排序(GroupBy Sorting) 在Pandas数据里面,我们通常使用groupby分组方法来进行数据分析,其中包含DataFrame.groupby(根据某一列分组)、DataFrame…

    python 2023年5月14日
    00
  • Pandas提高数据分析效率的13个技巧汇总

    引言 在数据分析的过程中,Pandas 是一款非常实用而又广泛应用的数据处理工具。本文将介绍 13 个利用 Pandas 提高数据分析效率的技巧,从而可以使数据分析的过程更加高效。这些技巧主要包括: 使用 Pandas 读取不同格式的数据文件 数据预处理:空值、重复值、异常值处理 数据切片和索引 数据排序 数据分组与聚合 数据合并 时间序列处理 可视化 数据…

    python 2023年5月14日
    00
  • 由Python编写的MySQL管理工具代码实例

    下面我将详细讲解“由Python编写的MySQL管理工具代码实例”的完整攻略。 简介 MySQL是当前最流行的关系型数据库之一,为了更简单高效地管理MySQL,可以使用Python编写MySQL管理工具,具备数据备份、数据恢复、数据迁移、数据比对等功能,方便管理人员更好地操作MySQL数据库。 开发环境准备 在开始编写MySQL管理工具之前,我们需要进行开发…

    python 2023年6月13日
    00
  • 利用Pandas读取文件路径或文件名称包含中文的csv文件方法

    Pandas是一个用于数据分析和处理的Python库。在实际的工作中,我们经常需要读取中文文件路径或文件名称包含中文的CSV文件。由于中文字符的编码问题,可能会导致读取文件失败,因此需要采取一些特殊的措施。以下是利用Pandas读取文件路径或文件名称包含中文的CSV文件的攻略: 1. 手动设置编码格式 Pandas读取CSV文件时默认的编码为utf-8,如果…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部