机器学习实战__KNN1

2023年4月12日上午9:30 • 机器学习

yizhihongxing

KNN的算法工作原理：

　　存在一个训练样本集合，样本集中每个数据都有确定的标签（分类），即我们知道样本集中每一数据与所属分类的对应关系。输人没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前K个最相似的数据，这就是K-近邻算法中K的出处,通常K是不大于20的整数。最后，选择K个最相似数据中出现次数最多的标签，作为新数据的分类。

一个KNN实战入门例子：

　　

from numpy import *
import operator

def createDataSet():
    group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels = ['A','A','B','B']
    return group, labels

def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    diffMat = tile(inX, (dataSetSize,1)) - dataSet
    sqDiffMat = diffMat**2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances**0.5
    sortedDistIndicies = distances.argsort()
    classCount={}
    for i in range(k):
        voteIlabel = labels[sortedDistIndicies[i]]
        classCount[voteIlabel] = classCount.get(voteIlabel,0)+1
        sortedClassCount = sorted(classCount.iteritems(),key = operator.itemgetter(1),reverse=True)
        return sortedClassCount[0][0]

KNN.py源码

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习实战__KNN1 - Python技术站

人工智能机器学习

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习实战__安装python环境

上一篇 2023年4月12日

[Machine Learning] 国外程序员整理的机器学习资源大全

下一篇 2023年4月12日

bmp图像插值算法近邻取样(效果最差，也最快)，双线性插值(效果可以,速度一般),三次卷积插值(效果最好,速度最慢)

UNCHAR3 ** CContourJudge::ImgInterp(int k, float imgfactor, float mode,UNCHAR3 **resimg) { int i,j; int pos; //UNCHAR3 ** reimg; long …

卷积神经网络 2023年4月8日
000
keras多层感知机MLP

肯定有人要说什么多层感知机，不就是几个隐藏层连接在一起的吗。话是这么说，但是我觉得我们首先要自己承认自己高级，不然怎么去说服（hu nong）别人呢 from keras.models import Sequential from keras.layers import Dense import numpy as np #设置随机种子，使得每次结果都…

Keras 2023年4月7日
000
Tensorflow+Keras 深度学习人工智能实践应用 Chapter Two 深度学习原理

2.1神经传导原理 y=activation（x*w+b）激活函数通常为非线性函数 Sigmoid 函数和 ReLU函数 2.2以矩阵运算模仿真神经网络 y=activation(x*w+b) 输出=激活函数（输入*权重+偏差） 2.3多层感知器模型 1以多层感知器模型识别minst 手写数字图像输入层的数据是28*28的二维图像以reshap…

Keras 2023年4月5日
000
pytorch loss总结与测试

pytorch loss 参考文献： https://blog.csdn.net/zhangxb35/article/details/72464152?utm_source=itdadao&utm_medium=referral loss 测试 import torch from torch.autograd import Variable ”…

PyTorch 2023年4月6日
000
caffe的python接口学习（3）训练模型training

如果不进行可视化，只想得到一个最终的训练model, 那么代码非常简单，如下 : import caffe caffe.set_device(0) caffe.set_mode_gpu() solver = caffe.SGDSolver(‘/home/xxx/data/solver.prototxt’) solver.solve()

Caffe 2023年4月6日
000
生成式对抗网络(GAN)实战——书法字体生成练习赛

https://www.tinymind.cn/competitions/ai 生成式对抗网络（GAN）是近年来大热的深度学习模型。目前GAN最常使用的场景就是图像生成，作为一种优秀的生成式模型，GAN引爆了许多图像生成的有趣应用。在图像生成模型的质量上，生成对抗网络技术可以说实现了飞跃，很多衍生模型已经在一定程度上解决了特定场景中的图像生成问题。此外…

GAN生成对抗网络 2023年4月5日
000
pytorch中的math operation: torch.bmm()

torch.bmm(batch1, batch2, out=None) → Tensor Performs a batch matrix-matrix product of matrices stored in batch1 and batch2. batch1 and batch2 must be 3-D tensors each containing t…

PyTorch 2023年4月8日
000
GAN生成对抗网络

GAN学习笔记：生成对抗网络

看了Ian大神的论文，学习一下GAN。一、基本介绍生成对抗网络由两部分组成：Generatative model 和 Discriminative model，以下分别简称为G 和 D。在GAN中，训练集是无标签数据集data，G接受数据z，产生G(z)，而D判定G产生的数据是来自于真实数据data还是由G产生的。在训练过程中，双方不断优化自己，直到D…

2023年4月6日
000

合作推广

合作推广

返回顶部