当使用Python进行数据可视化时,常会用到matplotlib这个包。其中的plt.scatter()函数就是用来绘制散点图的。本文将对plt.scatter()函数的常见用法进行小结。
1. plt.scatter()函数的基本用法
plt.scatter()函数的基本语法如下:
plt.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, plotnonfinite=False, data=None, **kwargs)
其中,x,y是数据点的横纵坐标,s是数据点的大小,c是数据点的颜色,marker是数据点的形状。
例如,下面的代码演示了如何使用plt.scatter()函数绘制一组数据点:
import matplotlib.pyplot as plt
import numpy as np
x = np.random.rand(100)
y = np.random.rand(100)
plt.scatter(x, y)
plt.show()
此代码中,我们使用numpy包生成了100组随机数据,并对这些数据点使用plt.scatter()函数进行了可视化。
运行代码,会展示出一个窗口,其中包含了100个随机的数据点。每个数据点的颜色为蓝色,大小为默认值(20个像素),形状为圆形。
2. 按照数据特征对数据点进行可视化
plt.scatter()函数的常见用法之一是按照数据特征对数据点进行可视化。例如,下面的代码演示了如何根据数据点的大小和颜色对数据点进行可视化:
import matplotlib.pyplot as plt
import numpy as np
x = np.random.randn(100)
y = np.random.randn(100)
size = np.random.randn(100) * 30
color = np.random.randn(100)
plt.scatter(x, y, s=size, c=color)
plt.colorbar()
plt.show()
此代码中,我们使用numpy包生成了100组随机数据,并对这些数据点使用plt.scatter()函数进行了可视化。其中,我们使用了随机生成的大小和颜色对数据点进行区分,并使用plt.colorbar()函数添加了颜色条。
运行代码,会展示出一个窗口,其中包含了100个随机的数据点。每个数据点的颜色和大小都是基于随机数据生成的,这样,我们就能够更容易地观察到不同的数据特征。
3. 将簇类别进行可视化
plt.scatter()函数的另一个常见用法是将簇类别进行可视化。例如,下面的代码演示了如何使用plt.scatter()函数将簇类别进行可视化:
import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
# 生成随机数据
X, y = make_blobs(n_samples=1000, centers=5, random_state=42)
# 聚类
kmeans = KMeans(n_clusters=5, random_state=42)
kmeans.fit(X)
# 将簇类别进行可视化
plt.scatter(X[:, 0], X[:, 1], c=kmeans.labels_)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], s=100, c='red')
plt.show()
此代码中,我们首先使用sklearn包中的make_blobs()函数生成了1000个随机数据点,并使用KMeans()函数将数据进行聚类。然后,我们使用plt.scatter()函数将簇类别进行可视化,并使用plt.scatter()函数将聚类中心可视化为红色。
运行代码,会展示出一个窗口,其中包含了1000个随机数据点。每个数据点的颜色根据所属的簇类别进行区分,而聚类中心则以红色进行可视化。
以上就是plt.scatter()函数的常见用法小结。通过使用这些技巧,我们可以更加方便地进行数据可视化。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中plt.scatter()函数的常见用法小结 - Python技术站