Python机器学习工具包SKlearn的安装与使用
安装SKlearn
安装SKlearn需要先安装Python,推荐安装Python 3.6
版本及以上的Python。
# 假设已经安装好Python 3.6,然后使用pip安装SKlearn
pip install sklearn
SKlearn的使用
示例1 —— 数据加载和数据预处理
下面的代码演示了加载sklearn
自带的鸢尾花数据集并进行数据预处理的过程。
# 1. 加载数据集
from sklearn.datasets import load_iris
iris = load_iris()
# 2. 打印数据集信息
print("数据集大小:", iris.data.shape)
print("数据集第一行:", iris.data[0])
# 3. 数据预处理
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
print(X_train.shape, y_train.shape)
print(X_test.shape, y_test.shape)
在上面的代码中,首先通过from sklearn.datasets import load_iris
命令加载了sklearn自带的鸢尾花数据集,然后使用iris.data
和iris.target
来访问这个数据集的输入和输出数据。接下来使用train_test_split
函数将整个数据集划分为训练集和测试集,其中test_size
表示测试集的比例,random_state
表示划分数据的随机种子。
示例2 —— 模型训练和测试
下面的代码演示了使用sklearn
训练和测试一个SVM分类器的过程。
# 1. 加载数据集
from sklearn.datasets import load_iris
iris = load_iris()
# 2. 数据预处理
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=0)
# 3. 训练SVM模型
from sklearn.svm import SVC
svm = SVC(kernel='linear', C=1.0)
svm.fit(X_train, y_train)
# 4. 使用模型测试数据
y_pred = svm.predict(X_test)
# 5. 计算精度
from sklearn import metrics
print("精度:", metrics.accuracy_score(y_test, y_pred))
在这段代码中,首先加载鸢尾花数据集并进行数据预处理,接着使用SVC
函数构造了一个线性SVM分类器,再使用fit
函数对模型进行训练。然后使用predict
函数对测试数据进行预测,使用metrics.accuracy_score
函数计算模型的精度。
结论
本文介绍了sklearn
的安装和应用,掌握了这些基础知识可以让我们更好地理解sklearn
的内部机制,并使用它来构建机器学习模型。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python 机器学习工具包SKlearn的安装与使用 - Python技术站