下面是Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解的完整攻略。
一、什么是箱图
箱图(Box Plot)也叫盒须图、盒式图,是一种用作显示数据分散情况的统计图。它能显示出一组数据的中位数、上下四分位数、最大和最小值以及异常值。
在箱图中,数据按照从小到大的顺序排列,然后将数据分成四份,每一份包含25%的数据。这四份数据分别是第一四分位数、第二四分位数、第三四分位数和最大/最小值,用箱体和箱须表示出来。
二、plt.boxplot()函数的用法
plt.boxplot()函数用于绘制箱图,它的语法如下:
plt.boxplot(x, notch=None, sym=None, vert=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None)
参数说明:
- x:绘制箱图的数据,可以是一个数组或多个数组
- notch:是否是凹口(True或False),默认为False
- sym:异常值的标记符号,默认为+
- vert:是否需要竖向排列箱图(True或False),默认为True
- whis:决定箱子的长度。箱线的两端为第一四分位数和第三四分位数,箱子的长度为IQR×whis。IQR为四分位距,whis默认为1.5。
- positions:指定箱图的位置
- widths:指定箱图的宽度
- patch_artist:是否给箱体添加背景颜色(True或False),默认为False
- bootstrap:是否进行置信区间的计算(可以指定置信区间计算方法或数值),默认为None
- usermedians:指定中位数的值
- conf_intervals:置信区间的计算方法,默认为None
三、常用方法
下面是几个常用的方法:
1. 水平箱图
要使用水平箱图,设置vert=False
即可。
import numpy as np
import matplotlib.pyplot as plt
# 生成数据
np.random.seed(123)
data = np.random.normal(size=100, loc=0, scale=10)
# 绘制水平箱图
plt.boxplot(data, vert=False)
# 设置图形标题和横纵坐标label
plt.title('Horizontal Box Plot')
plt.xlabel('Value')
plt.ylabel('Dataset')
plt.show()
2. 多组数据箱图
要绘制多组数据的箱图,只需要在plt.boxplot()
函数中传入多个数组即可。
import numpy as np
import matplotlib.pyplot as plt
# 生成多组数据
np.random.seed(123)
data1 = np.random.normal(size=100, loc=0, scale=10)
data2 = np.random.normal(size=100, loc=5, scale=10)
data3 = np.random.normal(size=100, loc=10, scale=10)
# 绘制多组数据的箱图
plt.boxplot([data1, data2, data3])
# 设置图形标题和横纵坐标label
plt.title('Multiple Box Plot')
plt.xlabel('Value')
plt.ylabel('Dataset')
plt.show()
四、结果解读
在箱图中,红线表示第一四分位数(Q1),绿线表示第二四分位数(Q2或中位数),蓝线表示第三四分位数(Q3)。箱体的上下边缘分别是第三四分位数加上1.5倍的箱体长度和第一四分位数减去1.5倍的箱体长度。超过这个范围的数据用点表示。
五、总结
以上就是Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解的攻略。希望可以帮助到大家。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解 - Python技术站