这里给出利用Seaborn绘制20个精美的pairplot图的完整攻略。
1. 确定数据集
首先,确定需要绘制的数据集,例如seaborn提供的自带数据集iris。
import seaborn as sns
iris = sns.load_dataset('iris')
2. 进行数据探索
接下来,可以对数据集进行初步探索,了解数据的特征和分布情况。
iris.head()
sns.pairplot(iris)
运行以上代码后,可以看到一张包含所有变量两两比较的散点图矩阵,可以从中了解各变量之间的相关性和分布情况。
3. 进行图形优化
可以通过修改图形元素的参数,对图形进行美化。例如修改散点图的点大小、修改坐标轴刻度等。
sns.pairplot(iris, height=2.5, aspect=1.2, diag_kind='kde',
plot_kws=dict(s=50, edgecolor='cyan', linewidth=0.5),
diag_kws=dict(shade=True, linewidth=1.5, alpha=0.8))
其中,height
和aspect
用于设置子图高度和宽高比;diag_kind
用于设置对角线上的图形类型,例如核密度估计图kde
;plot_kws
用于设置散点图的参数,例如点大小s
、边框颜色edgecolor
和边框宽度linewidth
;diag_kws
用于设置对角线上图形的参数,例如阴影shade
、线宽linewidth
和透明度alpha
等。
4. 绘制特定变量对
如果只需要绘制某些特定变量之间的关系,可以选择使用pairplot()
的vars
参数来指定需要绘制的变量名,例如:
sns.pairplot(iris, vars=['sepal_length', 'sepal_width'])
以上代码只会绘制sepal_length
和sepal_width
两个变量之间的散点图。
示例1:绘制不同种类之间的关系
以下代码用于绘制iris数据集中不同种类之间变量的关系。
sns.pairplot(iris, hue='species', height=2.5, aspect=1.2, palette='husl')
其中,hue
参数用于指定需要按照哪个变量的类别进行分类,例如这里的species
表示不同的鸢尾花种类。
示例2:绘制不同类别之间的关系
以下代码用于绘制titanic数据集中不同性别、不同存活情况之间的变量关系。
titanic = sns.load_dataset('titanic')
sns.pairplot(titanic, hue='survived', vars=['age', 'fare', 'class'],
height=2.5, aspect=1.2, palette='muted',
plot_kws=dict(s=50, edgecolor='red', linewidth=0.5),
diag_kws=dict(shade=True, linewidth=1.5, alpha=0.8))
以上代码绘制了三个变量age
、fare
和class
在性别和存活情况两个类别中的关系。通过vars
参数可以指定需要绘制的变量,hue
参数指定需要按照哪个变量的类别进行分类,这里是survived
,也就是存活情况。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:利用Seaborn绘制20个精美的pairplot图 - Python技术站