Pandas 格式化日期时间

当进行数据分析时,我们会遇到很多带有日期、时间格式的数据集,在处理这些数据集时,就需要对日期时间做统一的格式化处理。

比如“Wednesday, June 6, 2023”可以写成“6/6/23”,或“06-06-2023”。

Pandas 中,我们可以使用 pd.to_datetime() 函数将日期字符串或时间戳转换为 Pandas 的日期时间类型。这在上一篇详解Pandas中的时间序列中有过讲解。

转换后,我们就可以使用 strftime() 函数将日期时间格式化为自己想要的字符串形式。

strftime() 函数:将日期时间格式化为字符串

strftime() 函数是 Python 中 datetime 模块中的一个方法,用于将 datetime 对象格式化为字符串。它的用法如下:

datetime_object.strftime(format)

其中,datetime_object 表示一个 datetime 对象,format 是一个字符串,用来指定 datetime 对象转换后的格式。

format 字符串中可以包含以下格式化符号:

格式化符号 含义
%Y 四位数的年份
%y 两位数的年份
%m 两位数的月份(01~12)
%B 月份的全称(January~December)
%b 月份的缩写名称(Jan~Dec)
%d 两位数的日期(01~31)
%H 24 小时制的小时数(00~23)
%I 12 小时制的小时数(01~12)
%p AM 或 PM
%M 两位数的分钟数(00~59)
%S 两位数的秒数(00~59)
%f 微秒(0~999999)
%j 一年中的第几天(001~366)
%U 一年中的第几周(00~53),以周日为一周的开始
%W 一年中的第几周(00~53),以周一为一周的开始
%w 一周中的第几天(0~6),以周日为 0,周六为 6
%c 本地日期时间
%x 本地日期
%X 本地时间
%% 百分号

例如,将当前时间转换为字符串,格式为 "2023-03-05 12:34:56",可以使用如下代码:

from datetime import datetime

now = datetime.now()
date_string = now.strftime('%Y-%m-%d %H:%M:%S')
print(date_string)

输出结果:
2023-03-05 12:34:56

Pandas 日期时间格式化

在 Pandas 中,也使用 strftime() 方法将日期时间格式化为字符串。

strftime() 方法同样也是 datetime 模块中的方法,可以用它来格式化时间戳。不同于 datetime 中直接传入时间戳,Pandas 的 Series 和 DataFrame 中存储的是 pandas.Timestamp 对象,因此需要将它们转换成 datetime 对象后再进行格式化。

例如,将一个 Pandas Series 中的日期时间格式化为字符串,格式为 "YYYY-MM-DD",可以使用如下代码:

import pandas as pd

# 创建一个包含日期时间的 Pandas Series
dates = pd.Series(['2022-01-01', '2022-01-02', '2022-01-03'])

# 将日期时间转换为 Pandas Timestamp 对象
dates = pd.to_datetime(dates)

# 将 Pandas Timestamp 对象转换为 datetime 对象
dates = dates.dt.to_pydatetime()

# 将 datetime 对象格式化为字符串
date_strings = [date.strftime('%Y-%m-%d') for date in dates]

print(date_strings)

输出结果:

['2022-01-01', '2022-01-02', '2022-01-03']

在上面的代码中,首先使用 pd.to_datetime() 方法将字符串格式的日期时间转换为 Pandas Timestamp 对象,然后使用 dt.to_pydatetime() 方法将 Pandas Timestamp 对象转换为 datetime 对象。最后使用 strftime() 方法将 datetime 对象格式化为字符串。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas 格式化日期时间 - Python技术站

(1)
上一篇 2023年3月6日
下一篇 2023年3月6日

相关文章

  • Pytorch 的损失函数Loss function使用详解

    Pytorch的损失函数Loss Function使用详解 在神经网络的模型训练过程中,损失函数是非常重要的一个组成部分。Pytorch作为一个深度学习框架,内置了许多常用的损失函数,可以快速地选择和使用。 1. Pytorch内置损失函数 在Pytorch中,常用的损失函数主要包括以下几种: nn.MSELoss: 均方误差损失函数,适合回归任务。 nn.…

    python 2023年5月14日
    00
  • 如何从嵌套的XML创建Pandas DataFrame

    创建 Pandas DataFrame 时,通常使用的是 CSV 或 Excel 等常见格式的表格数据。但实际上,Pandas 还提供了非常便捷的方法来从 XML 格式的数据中创建 DataFrame。本文将详细讲解如何从嵌套的 XML 创建 Pandas DataFrame。 数据准备 我们先准备一个嵌套的 XML 示例数据,如下: <?xml ve…

    python-answer 2023年3月27日
    00
  • 如何在一个DataFrame中绘制多个数据列

    在一个DataFrame中绘制多个数据列可以让我们更直观地比较不同数据之间的关系和趋势,这里提供一个完整的攻略。 1. 准备工作 首先,我们需要准备好数据,可以通过Pandas读取CSV、Excel等格式的数据。 以读取CSV文件为例,可以使用如下代码: import pandas as pd df = pd.read_csv(‘data.csv’) 其中,…

    python-answer 2023年3月27日
    00
  • 如何在DataFrame中获得列和行的名称

    获取DataFrame中的列名称和行名称可以使用index和columns属性。 获取列名称 可以通过DataFrame的columns属性获取DataFrame中的所有列名称,该属性是pandas Index对象的实例。以下是代码示例: import pandas as pd df = pd.DataFrame({‘col1’: [1, 2], ‘col2…

    python-answer 2023年3月27日
    00
  • pandas计算最大连续间隔的方法

    下面是针对“pandas计算最大连续间隔的方法”的攻略: 步骤一:导入pandas和numpy库 要使用pandas计算最大连续间隔,首先需要导入必要的库。使用以下代码导入pandas和numpy库: import pandas as pd import numpy as np 步骤二:创建示例数据集 为了演示如何计算最大连续间隔,我们需要创建一个示例数据集…

    python 2023年6月13日
    00
  • R语言rhdf5读写hdf5并展示文件组织结构和索引数据

    R语言是一种流行的数据分析语言,它可以通过rhdf5包读写hdf5格式的数据。hdf5是Hierarchical Data Format的缩写,是一种通用的数据格式,用于存储和组织大量的科学数据。在本攻略中,我将详细讲解使用R语言rhdf5包读写hdf5文件以及展示文件组织结构和索引数据的过程。 安装rhdf5包 在开始之前,我们需要安装并加载rhdf5包。…

    python 2023年6月13日
    00
  • Pandas数据类型之category的用法

    下面是对“Pandas数据类型之category的用法”的详细讲解攻略。 什么是category类型 Pandas中的category数据类型,称为分类数据类型,是针对具有固定数量的不同值的数据进行有效管理的数据类型。在这种数据类型中,重复的数据仅保存一次。 方便快捷地对这种数据进行分组和排序。 在数据集中,用户的性别、部门、优先级、状态、等级和类型等属性通…

    python 2023年5月14日
    00
  • 将Lambda函数应用于Pandas Dataframe

    让我们详细讲解如何将Lambda函数应用于Pandas Dataframe。 1. 理解Lambda函数 Lambda函数也称为匿名函数,是一种不需要使用def语句定义的函数。Lambda函数的结果是一个函数对象,可以用于执行某些特定任务,但是它的主要优点是可以方便地将其传递给其他函数作为参数。 例如,下面的Lambda函数是用于计算两个数的和: add =…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部