Pandas是基于Numpy库的另一个数据处理库,同时也是Python数据分析工具的一个重要组成部分。Pandas中的DataFrame对象提供.hist()函数,可以方便地绘制数据的直方图。
函数概述
DataFrame.hist(by=None,ax=None,grid=True,xlabelsize=None,ylabelsize=None,** kwargs)
参数说明
by : str or sequence, optional 按照某个或多个因素进行分组
ax : Matplotlib axes object, default None 要使用的轴对象。如果没有给定,则使用当前轴。
grid : bool, default True 是否在图形背景中添加网格线
xlabelsize : int, default None x标签大小
ylabelsize : int, default None y标签大小
**kwargs : dict 其他关键字参数,用于转发给matplotlib.pyplot.hist()
示例说明
为了演示这个函数的使用方法,我们首先要导入Pandas和Numpy库。
import pandas as pd
import numpy as np
接下来,我们构造一个5行5列的DataFrame对象,行列索引均为1-5。
df = pd.DataFrame(np.random.randn(5,5),index=[1,2,3,4,5],columns=list('ABCDE'))
现在,我们可以使用DataFrame.hist()函数向数据中的每一列绘制直方图。以下是一个简单的调用示例:
df.hist()
这将为数据中的每列绘制直方图,并自动计算每个值的频率。
如果需要按照某个或多个因素进行分组,则可以使用by参数来指定分组的因素。以下是分组示例:
df.hist(by='A')
这将为数据中'A'列的每个唯一值绘制一个子图,并显示每个值的频率。
最后,我们还可以传递其他参数来自定义直方图的绘制样式。例如,我们可以使用grid参数来控制是否显示网格线。
df.hist(grid=False)
以上实例中,我们取消了网格线的显示。
综上所述,我们可以使用Pandas.DataFrame.hist()函数轻松地绘制数据的直方图,并随时根据需要进行自定义。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中的Pandas.DataFrame.hist()函数 - Python技术站