详解pandas.to_datetime()(转换为日期时间格式)函数使用方法

yizhihongxing

pandas.to_datetime()是pandas模块中的一个函数,作用是将传入的字符串解析成时间序列类型的数据。该函数可以将多种形式的字符串,如ISO8601、 Unix Epoch时间戳、dateutil.parser解析的任意格式字符串等,转化为pandas日期时间格式。

使用方法

pandas.to_datetime(arg, errors=’raise’, dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_datetime_format=False, origin=’unix’)

参数说明:

  • arg:需要转化为日期类型的数据。
  • errors:默认为’raise’,表示如果存在无法转换的数据则抛出异常(ValueError),也可以设置为’coerce’,表示转换失败的数据将被设置为NULL,或者设置为’ignore’,表示忽略转换失败的数据。
  • dayfirst/yearfirst:默认为False/False,表示传入数据的月份位于字符串的哪一位。设置dayfirst=True时,表示日期在月份之前;设置yearfirst=True时,表示年份在月份之前。
  • utc:默认为None,表示将时区设置为UTC,也可以设置其他时区。
  • box:默认为True,表示返回的日期类型数据是否为pandas.Timestamp或pandas.DatetimeIndex,True表示为Timestamp或DatetimeIndex,False表示仅仅只是numpy.ndarray类型。
  • format:解析日期的格式字符串。 被解析的字符串中的每个元素必须单独对应格式字符串中的某个格式。
  • exact:默认为True,可以提高性能。但是,如果用户自定义日期格式字符串,则必须将其设置为False,否则此参数将被忽略。
  • unit:仅在被转换的数据是一个UNIX时间戳时使用,表示时间的单位。
  • infer_datetime_format:默认为False,表示是否启用推断方式解析日期。这将会运用推断方式使pandas快速解析性能更高。

示例1

import pandas as pd

# test data
date_str = '2022-10-10'

# convert string to datetime (Timestamp)
date_dt = pd.to_datetime(date_str)

# output the result
print(date_dt)
print(type(date_dt))

输出结果为:

2022-10-10 00:00:00
<class 'pandas._libs.tslibs.timestamps.Timestamp'>

示例2

import pandas as pd

# test data
date_list = ['2022-10-10', '2013-05-31', '2022/12/12', '2011/11/11', '2015.6.1', '20150101']

# convert list of string to datetime (DatetimeIndex)
date_dt = pd.to_datetime(date_list, errors='coerce', dayfirst=True, exact=False)

# output the result
print(date_dt)
print(type(date_dt))

输出结果为:

DatetimeIndex(['2022-10-10', '2013-05-31', '2022-12-12', '2011-11-11','2015-06-01', '2015-01-01'], dtype='datetime64[ns]', freq=None)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>

在这个示例中,我们将一个由多种格式的日期组成的列表传入pandas.to_datetime()函数中,并在细节处理上进行了设置。同时,设置了errors参数为'coerce',意思是当解析错误的时候,Series将被设置为null。我们还将dayfirst参数设置为True,因为这个日期中的月份位于第一个而不是第二个位置。注意到exact参数被设置为False,这是因为我们转化列表中的日期是无法确定的格式。最后,我们看到一个DatetimeIndex的对象被返回了,因为我们传入的对象是一个列表。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:详解pandas.to_datetime()(转换为日期时间格式)函数使用方法 - Python技术站

(1)
上一篇 2023年3月22日
下一篇 2023年3月22日

相关文章

  • 详解pandas.str.replace()(字符串替换)函数使用方法

    pandas.str.replace() 函数用于替换 Series 或 DataFrame 中的子字符串。 语法: pandas.str.replace(pat, repl, n=-1, case=None, flags=0, regex=True) 参数介绍: pat:被替换的子字符串 repl:替换 pat 的字符串 n:要替换的子字符串数量。默认值是…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.fillna()(填充缺失值)函数使用方法

    pandas.fillna() 用于对缺失值进行填充,可以将缺失值替换为指定的数值或使用指定的填充规则进行填充。该函数的语法格式如下: DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None) 其中各参数的含义如下: value…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.DataFrame.corr()(计算数据框相关系数)函数使用方法

    pandas.DataFrame.corr()作用与使用方法 pandas.DataFrame.corr()是pandas中DataFrame对象的方法,用于计算DataFrame中列与列之间的相关性矩阵。该方法的返回值是一个相关性矩阵,矩阵的行与列分别对应着DataFrame中的列。 使用方法有如下参数: method:计算相关性的方法,包括’pearso…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.map()(映射数值)函数使用方法

    pandas.map()函数的作用是对Series对象中的每一个元素都应用一个函数,并返回一个新的Series对象,其中新的Series对象的元素是原Series对象元素经过函数处理的结果。 使用方法: pandas.map(function, na_action=None) 参数说明: function:函数类型,对每个元素应用的函数。 na_action…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.concat()(合并数据框)函数使用方法

    Pandas.concat()的作用 Pandas库中的concat()函数主要用于合并/拼接一个或多个数据帧。数据帧可以是行方向(axis=0)或列方向(axis=1)的合并,merge的结果就是一个新的数据帧。合并的数据帧可以从多个源获取,这使得它成为数据处理和分析中非常有用的工具。 Pandas.concat()的使用方法 Pandas.concat(…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.DataFrame.sort_index()(按索引排序)函数使用方法

    pandas.DataFrame.sort_index()的作用与使用方法: sort_index()是pandas.DataFrame类中的一个方法,其作用是按照DataFrame的索引进行排序。 sort_index()可以按照行索引或列索引进行排序,默认情况下是按照行索引进行排序。 sort_index()的语法如下: DataFrame.sort_i…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.duplicated()(检测重复值)函数使用方法

    pandas.duplicated()是Pandas库中的一个函数,用于查找和标记重复值。它返回一个布尔值的数组,指示每个元素是否为重复项。 使用方法 语法: pandas.duplicated(subset=None, keep=’first’) 参数: subset: 可选,用于标识重复项的列名或列名列表。默认情况下,它比较整个行。 keep: 可选,标…

    Pandas函数大全 2023年3月22日
    00
  • 详解pandas.Series()(创建一维序列)函数使用方法

    pandas.Series()的作用: pandas.Series()是pandas库中的一种数据结构,用于表示一维数据,类似于带标签的数组。可以将Series视为带标签的列表或字典。Series对象具有许多方便的属性和方法,可以轻松操作数据。使用pandas.Series()可以方便地建立、处理、分析和可视化数据。 使用方法: pandas.Series(…

    Pandas函数大全 2023年3月22日
    00
合作推广
合作推广
分享本页
返回顶部