当我们使用pandas模块进行数据处理时,常常需要处理日期时间数据。pandas.date_range()是pandas模块中常用的日期生成器,它可以按照指定的频率(如天、小时、分钟)生成一段日期范围内的时间序列,同时也可以指定日期范围的开始时间点、结束时间点等参数。
语法
pandas.date_range(start=None, end=None, periods=None, freq='D', tz=None, normalize=False, name=None, closed=None, **kwargs)
参数说明
start
:生成日期范围的起始时间。可以是日期时间字符串、datetime对象、Timestamp对象或其他兼容类型对象。如果未指定,则默认为1970年1月1日。end
:生成日期范围的结束时间。可以是日期时间字符串、datetime对象、Timestamp对象或其他兼容类型对象。如果未指定,则默认为当前时间。periods
:序列中时间点的数量。默认是None
,必须指定end
或periods
中的至少一个参数。freq
:生成日期范围的频率。可以是字符串或DateOffset对象。常用的包括'D'(频率为天)、'H'(频率为小时)、'T'(频率为分钟)等,更多请参考官方文档,默认为'D'。tz
:时区。normalize
:是否对输出的时间进行标准化,使用默认值True
即可。name
:返回值的名称。closed
:关闭那些端点('left'或'right')。
示例说明
- 生成月份序列
import pandas as pd
dates = pd.date_range('20190101', '20191231', freq='M')
print(dates)
输出:
DatetimeIndex(['2019-01-31', '2019-02-28', '2019-03-31', '2019-04-30',
'2019-05-31', '2019-06-30', '2019-07-31', '2019-08-31',
'2019-09-30', '2019-10-31', '2019-11-30', '2019-12-31'],
dtype='datetime64[ns]', freq='M')
生成了从2019年1月份到12月份的月份序列。
- 生成指定间隔的时间戳序列
import pandas as pd
dates = pd.date_range(start='2020-01-01', periods=10, freq='12H30T')
print(dates)
输出:
DatetimeIndex(['2020-01-01 00:00:00', '2020-01-01 12:30:00',
'2020-01-02 01:00:00', '2020-01-02 13:30:00',
'2020-01-03 02:00:00', '2020-01-03 14:30:00',
'2020-01-04 03:00:00', '2020-01-04 15:30:00',
'2020-01-05 04:00:00', '2020-01-05 16:30:00'],
dtype='datetime64[ns]', freq='750T')
生成了从2020年1月1日开始,每隔12小时30分钟生成一次时间戳,总共生成10个时间戳。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:关于pandas.date_range()的用法及说明 - Python技术站