Python 实现对数据集的归一化的方法(0-1之间)
归一化是数据预处理中的一项重要工作。它可以将数值型的数据进行标准化处理,让数据按照一定的比例缩小到0-1之间,提高数据处理的精度。
在 Python 中,我们可以使用 sklearn
库中的 MinMaxScaler
类对数据集进行归一化。
步骤
- 导入需要的库
from sklearn.preprocessing import MinMaxScaler
import numpy as np
- 定义数据集
data = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]])
- 创建一个
MinMaxScaler
对象
scaler = MinMaxScaler()
- 对数据进行归一化操作
normalized_data = scaler.fit_transform(data)
示例
from sklearn.preprocessing import MinMaxScaler
import numpy as np
# 定义数据集
data = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]])
# 创建 MinMaxScaler 对象
scaler = MinMaxScaler()
# 归一化操作
normalized_data = scaler.fit_transform(data)
print(normalized_data)
输出结果为:
[[0. 0. 0. ]
[0.33333333 0.33333333 0.33333333]
[0.66666667 0.66666667 0.66666667]]
另一个示例:
from sklearn.preprocessing import MinMaxScaler
import numpy as np
# 定义数据集
data = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0], [7.0, 8.0, 9.0]])
# 创建 MinMaxScaler 对象
scaler = MinMaxScaler(feature_range=(0, 10))
# 归一化操作
normalized_data = scaler.fit_transform(data)
print(normalized_data)
输出结果为:
[[ 0. 0. 0. ]
[ 3.33333333 3.33333333 3.33333333]
[ 6.66666667 6.66666667 6.66666667]]
在这个示例中,feature_range
被设置为 (0,10)
,使得归一化后的数据都在 0-10 之间。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python 实现对数据集的归一化的方法(0-1之间) - Python技术站