机器学习:感知器（perceptron）

2023年4月9日下午11:50 • 机器学习

感知器以一个实数值向量作为输入，计算这些输入的线性组合，然后如果结果大于某个阈值就输出1 ，否则输出-1 。

更精确地，如果输入为x，那么感知器计算的输出为：

机器学习:感知器（perceptron）

其中每一个w _i 是一个实数常量，或叫做权值（weight ），用来决定输入xi 对感知器输出的贡献率。

请注意，常量(w₀) 是一个阈值，它是为了使感知器输出 1 ，输入的加权和w₁x₁+w₂x₂+...+w_nx_n必须超过的阈值。

机器学习:感知器（perceptron）

（此图是从网上扒来的，上图下方的的b对应于w₀,1对应于x_1，f的图像类似如下）

机器学习:感知器（perceptron）

为了简化表示，我们假想有一个附加的常量输入x₀=1，那么我们就可以把上边的不等式写成：

　　　　　　　　　　　　　　　　　　机器学习:感知器（perceptron）

或以向量形式写为机器学习:感知器（perceptron）。为了简短起见，有时会把感知器函数写成:

　　　　　　　　　　　　　　　　　　　　　　　　　　　　机器学习:感知器（perceptron），

其中：

　　　　　　　　　　　　　　　　　　　　　　　　机器学习:感知器（perceptron）

学习一个感知器意味着选择权w₀,......w_n的值。

1感知器的表达能力

我们可以把感知器看作n维实例空间（即点空间）中的超平面决策面。对于超平面一侧的实例，感知器输出1，对于另一侧的实例输出-1，如图1所示。这个决策超平面方程是机器学习:感知器（perceptron）。当然，某些正反样例集合不可能被任一超平面分割。那些可以被分割的成为线性可分（linearly separable）的样例集合。

机器学习:感知器（perceptron）

　　　　　　图 1

单独的感知器可以用来表示很多布尔函数。

例如，假如用1（真）和-1（假）表示布尔值，那么使用一个有两输入的感知器来实现与函数（AND）的一种方法就是设置w₀=-0.8，w₁=w₂=0.5。

x1	x2	x3	输出
1	1	1	1
1	1	-1	-1
1	-1	1	-1
1	-1	-1	-1

同样的，这个感知器也可以来表示或函数（OR），那么只要改变它的权值w0=-0.3.

感知器可以表示所有的原子布尔函数（primitive boolean function）：与，或，与非和或非。然而遗憾的是，一些布尔函数无法用单一的感知器表示，例如异或函数（XOR），它当且仅当x₁≠ x₂,时输出为1.

图2中线性不可分的训练样例集对应于异或函数。

机器学习:感知器（perceptron）

　　图2

感知器表示与、或、与非、或非的能力是很重要的，因为所有的布尔函数都可表示为基于这些原子函数的互连单元的某个网络。

事实上，仅用两层深度的感知器网络就可以表示所有的布尔函数，在这些网络中输入被送到多个单元，这些单元的输出被输入到第二级，也是最后一级。

因为阈值单元的网络可以表示大量的函数，而单独的单元不能做到这一点，所以通常我们感兴趣的是学习阈值单元组成的多层网络。

2感知器训练法则

现在我们来解决如何学习单个感知器的权值，也就是决定一个权向量，使得感知器对于给定的训练样例输出正确的1或-1.

为得到可接受的权向量，一种办法是从随机的权值开始，然后反复地应用这个感知器到每个训练样例，只要它误分类样例就修改感知器的权值。重复这个过程，知道感知器能正确分类所有的训练样例。

每一步根据感知器训练法则（perceptron training rule）来修改权值，也就是修改与输入 x_i对应的权 w_i法则如下：

　　　　　　　　　　　　　　　　　　　　　　　　机器学习:感知器（perceptron）

其中：

　　　　　　　　　　　　　　　　　　　　　　机器学习:感知器（perceptron）

这里t是当前训练样例的目标输出，O是感知器的输出（1或-1），η是一个正的常数称为学习速率（learning rate）学习速率的作用是缓和每一步调整权的程度。它通常被设为一个小的数值（例如0.1），而且有时会使其随着权调整次数的增加而衰减。

对于权值的调整是一例一调，也就是输入一个样例，就计算每个Δw_i, 来调整w_i的值，一直训练到会收敛到一个能一个能正确分类所有训练样例的权向量，前提是训练样例线性可分，并且使用了充分小的η 。如果数据不是线性可分的，那么不能保证收敛。

实验：

利用感知器法则来训练训练感知器能够正确的表示与函数（AND）

训练样本：

1 1 1
1 -1 -1
-1 1 -1
-1 -1 -1

头文件

#ifndef HEAD_H_INCLUDED
#define HEAD_H_INCLUDED
#include <iostream>
#include <fstream>
#include <vector>
#include <cstdio>
#include <cstdlib>
#include <cmath>
#include <ctime>

using namespace std;

const int DataRow=4;
const int DataColumn=3;             
const double learning_rate=.1;                  //学习速率
extern double DataTable[DataRow][DataColumn+1]; //训练样例
extern double Theta[DataColumn];          // 权值
const double loss_theta=0.001;           // 误差阈值
const int iterator_n =1000;             //迭代次数


#endif // HEAD_H_INCLUDED

源代码：

#include "head.h"

double DataTable[DataRow][DataColumn+1];
double Theta[DataColumn];

void Init()
{
    srand((unsigned)time(NULL));
    ifstream fin("data.txt");
    for(int i=0;i<DataRow;i++)
    {
        DataTable[i][0]=1;      // x1 默认为 1
        for(int j=1;j<DataColumn+1;j++)
        {
            fin>>DataTable[i][j];
        }
    }
    if(!fin)
    {
        cout<<"fin error";
        exit(1);
    }
    fin.close();
    for(int i=0;i<DataColumn;i++)
    {
        Theta[i]=rand()%1000/(double)10000;;      //随机初始化theta
    }
}
int perceptron(double a)
{
    if(a>0)
        return 1;
    else if(a<0)
        return -1;
    else
    {
        cout<<"perceptron error";
        exit(0);
    }
}

void perceptron_rule()
{
    double loss=100;
    for(int i=0;i<iterator_n&&loss>=loss_theta;i++)
    {
        loss=0;//训练误差
        for(int j=0;j<DataRow;j++)
        {
            double error=0;
            for(int k=0;k<DataColumn;k++)
            {
                error+=DataTable[j][k]*Theta[k];
            }
            error=DataTable[j][DataColumn]-perceptron(error);    //计算t-o
            for(int k=0;k<DataColumn;k++)
            {
                Theta[k]+=learning_rate*error*DataTable[j][k];  //更新Theta
            }
            loss+=abs(error);
        }
    }
}
void printTheta()
{
    for(int i=0;i<DataColumn;i++)
        cout<<Theta[i]<<" ";
    cout<<endl;
}

int main()
{
    Init();
    perceptron_rule();
    printTheta();
    return 0;
}

结果

theta：

-0.1712 0.2836 0.2456

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：机器学习:感知器（perceptron） - Python技术站

机器学习

0 0 打赏

微信扫一扫

支付宝扫一扫

机器学习入门之sklearn介绍

上一篇 2023年4月9日下午11:50

机器学习:梯度下降和delta法则

下一篇 2023年4月9日下午11:51

《机器学习基石》—验证

本节涉及的知识点：（1）用验证来选择参数和模型；（2）验证的流程；（3）验证集大小的选择；（4）留一交叉验证的流程；（5）留一交叉验证的理论保证；（6）留一交叉验证的缺点；（7）k折交叉验证的流程。我们可以用验证来从如下的组合中做选择：验证的流程是：先划分训练集Dt和验证集Dv，在训练集上选择不同的模型和参数做训练，得到不同的模型。…

机器学习 2023年4月12日
000
【Python】Pandas读取 excel 机器学习之数据预处理，Pandas读取excel数据

CSV和EXCEL： excel文件和 csv 文件的区别在于前者有分页（sheet），而且用文档编辑器打开的话会发现 excel 一行之间的单元格是以英文逗号 “,” 结尾，而 csv 是以制表 “\t” 结尾。注意一点的是，并不是所有得到文件其内容都很规范，比如在一个单元格里面有一大段句子含有英文逗号，就会导致生成 DataFrame 出现问题。所以在导…

机器学习 2023年4月13日
000
scikit-learn 和pandas 基于windows单机机器学习环境的搭建

　　　　很多朋友想学习机器学习，却苦于环境的搭建，这里给出windows上scikit-learn研究开发环境的搭建步骤。　　　　python有2.x和3.x的版本之分，但是很多好的机器学习python库都不支持3.x，因此，推荐安装2.7版本的python。当前最新的python是2.7.12.链接如下：　　　　https://www.python.o…

机器学习 2023年4月13日
000
关于机器学习中线性分类器与非线性分类器的几点思考

2017 3.1在一点钟从宿舍爬起来去实验室，看了一篇论文，产生如下思考。纪念下第一次通宵学习，哈哈。悖论1：任何的快速线性分类器可以被应用生成一个整体的非线性分类器。如下图：正方形是一个非线性分类器，那么他不就是由四个线性分类器组成的吗悖论2：若干个线性特征可以组成一个整体的非线性特征。有的人说，如果特征平行呢，如果平行，那么特征的相关系数就是1，它…

机器学习 2023年4月12日
000
大数据关键技术：常规机器学习方法

机器学习方法简介机器学习、人工智能、深度学习是什么关系？机器学习研究和构建的是一种特殊算法（而非某一个特定的算法），能够让计算机自己在数据中学习从而进行预测。 Arthur Samuel给出的定义指出，机器学习是这样的领域，它赋予计算机学习的能力（这种学习能力）不是通过显著式编程获得的。不管是机器学习还是深度学习，都属于人工智能（AI）的范畴。所以人工…

机器学习 2023年4月11日
000
Anomaly Detection Python机器学习笔记异常点检测算法——Isolation Forest Python机器学习笔记——One Class SVM PAC在异常检测中的应用异常检测: 应用多元高斯分布进行异常检测

数据集中的异常数据通常被成为异常点、离群点或孤立点等，典型特征是这些数据的特征或规则与大多数数据不一致，呈现出“异常”的特点，而检测这些数据的方法被称为异常检测。　　异常数据根据原始数据集的不同可以分为离群点检测和新奇检测：离群点检测(Outlier Detection) 　　大多数情况我们定义的异常数据都属于离群点检测，对这些数据训练完之…

机器学习 2023年4月13日
000
机器学习：数据处理、算法选择、算法验证

1. 数据处理转换数据格式比如将名称用数字表示、浮点数转为整数特征值的类型离散型还是连续型，这会影响算法的选择特征值的提取去掉没用的数据比如 ID 值去掉发生频率太低的特征直接提取有用的特征需要的话整合特征，比如取一段时间内的均值做特征值取两列数据的和做特征值取两列数据的皮尔逊相关系数 (Pearson …

机器学习 2023年4月10日
000
机器学习-LR推导及与SVM的区别

之前整理过一篇关于逻辑回归的帖子，但是只是简单介绍了一下了LR的基本思想，面试的时候基本用不上，那么这篇帖子就深入理解一下LR的一些知识，希望能够对面试有一定的帮助。 1、逻辑斯谛分布介绍逻辑斯谛回归模型之前，首先看一个并不常见的概率分布，即逻辑斯谛分布。设X是连续随机变量，X服从逻辑斯谛分布是指X具有如下的累积分布函数和概率密度函数：式中，μ为…

机器学习 2023年4月9日
000

机器学习:感知器（perceptron）

1感知器的表达能力

2感知器训练法则

实验：

相关文章