pandas.to_datetime()是pandas模块中的一个函数,作用是将传入的字符串解析成时间序列类型的数据。该函数可以将多种形式的字符串,如ISO8601、 Unix Epoch时间戳、dateutil.parser解析的任意格式字符串等,转化为pandas日期时间格式。
使用方法
pandas.to_datetime(arg, errors=’raise’, dayfirst=False, yearfirst=False, utc=None, box=True, format=None, exact=True, unit=None, infer_datetime_format=False, origin=’unix’)
参数说明:
- arg:需要转化为日期类型的数据。
- errors:默认为’raise’,表示如果存在无法转换的数据则抛出异常(ValueError),也可以设置为’coerce’,表示转换失败的数据将被设置为NULL,或者设置为’ignore’,表示忽略转换失败的数据。
- dayfirst/yearfirst:默认为False/False,表示传入数据的月份位于字符串的哪一位。设置dayfirst=True时,表示日期在月份之前;设置yearfirst=True时,表示年份在月份之前。
- utc:默认为None,表示将时区设置为UTC,也可以设置其他时区。
- box:默认为True,表示返回的日期类型数据是否为pandas.Timestamp或pandas.DatetimeIndex,True表示为Timestamp或DatetimeIndex,False表示仅仅只是numpy.ndarray类型。
- format:解析日期的格式字符串。 被解析的字符串中的每个元素必须单独对应格式字符串中的某个格式。
- exact:默认为True,可以提高性能。但是,如果用户自定义日期格式字符串,则必须将其设置为False,否则此参数将被忽略。
- unit:仅在被转换的数据是一个UNIX时间戳时使用,表示时间的单位。
- infer_datetime_format:默认为False,表示是否启用推断方式解析日期。这将会运用推断方式使pandas快速解析性能更高。
示例1
import pandas as pd
# test data
date_str = '2022-10-10'
# convert string to datetime (Timestamp)
date_dt = pd.to_datetime(date_str)
# output the result
print(date_dt)
print(type(date_dt))
输出结果为:
2022-10-10 00:00:00
<class 'pandas._libs.tslibs.timestamps.Timestamp'>
示例2
import pandas as pd
# test data
date_list = ['2022-10-10', '2013-05-31', '2022/12/12', '2011/11/11', '2015.6.1', '20150101']
# convert list of string to datetime (DatetimeIndex)
date_dt = pd.to_datetime(date_list, errors='coerce', dayfirst=True, exact=False)
# output the result
print(date_dt)
print(type(date_dt))
输出结果为:
DatetimeIndex(['2022-10-10', '2013-05-31', '2022-12-12', '2011-11-11','2015-06-01', '2015-01-01'], dtype='datetime64[ns]', freq=None)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'>
在这个示例中,我们将一个由多种格式的日期组成的列表传入pandas.to_datetime()函数中,并在细节处理上进行了设置。同时,设置了errors参数为'coerce',意思是当解析错误的时候,Series将被设置为null。我们还将dayfirst参数设置为True,因为这个日期中的月份位于第一个而不是第二个位置。注意到exact参数被设置为False,这是因为我们转化列表中的日期是无法确定的格式。最后,我们看到一个DatetimeIndex的对象被返回了,因为我们传入的对象是一个列表。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:详解pandas.to_datetime()(转换为日期时间格式)函数使用方法 - Python技术站