箱型图(box plot)是一种用于展示一组数据分散情况的图形方式。箱型图能够直观地反映数据的中位数、四分位数、最小值、最大值以及异常值等统计量。
在Matplotlib中,使用boxplot()函数可以绘制箱型图,其参数含义如下:
- x:数据集,可以是numpy数组,也可以是pandas序列;
- notch:是否绘制缺口形式的箱型图,默认为False;
- sym:指定异常值的形状,默认为‘+’;
- vert:是否绘制垂直箱型图,默认为True;
- whis:指定须的长度,默认为1.5,即1.5倍的箱体高度;
- widths:指定箱体的宽度,默认为0.5;
- labels:指定箱体的标签,用于刻画不同的数据集;
- meanline:是否绘制平均数线,默认为False;
- showmeans:是否绘制均值符号,默认为False;
- showcaps:是否绘制限制线,默认为True;
- showbox:是否绘制箱体,默认为True;
- showfliers:是否绘制异常值,默认为True。
下面是使用Matplotlib绘制箱型图的示例代码:
import numpy as np
import matplotlib.pyplot as plt
# 生成一组随机数
np.random.seed(123)
data1 = np.random.normal(0, 1, 200)
# 绘制箱型图
plt.boxplot([data1],
notch=True,
vert=False,
sym='+',
whis=1.5,
widths=0.7,
labels=['data1'],
meanline=True,
showmeans=True,
showcaps=True,
showbox=True,
showfliers=True)
# 添加标题和标签
plt.title('Box plot of data1')
plt.xlabel('Value')
plt.ylabel('Data')
plt.show()
运行以上代码,即可绘制出如图所示的箱型图:
可以看到,Matplotlib的箱型图既可以展现单个数据集的信息,也可以展示多个数据集进行比较。此外,还可以使用subplots()函数将多个箱型图绘制在同一张图中,以便更加直观地对比数据。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Matplotlib绘制箱型图方法详解 - Python技术站