深度学习-基础

基础环境配置Anaconda

主要应用其中的两个组件:

1.Anaconda prompt 用来安装包(框架)

2.Jupyter notebook 网页版的编译器,(可以通过修改属性,更改根目录)

www.image-net.org

机器学习的基本路线

一个图像分为 长h 宽w 颜色c(r,g,b)

三维数组,其中每一个数据代表一个像素点

1.收集数据并给定标签

2.训练一个分类器

3.测试,评估

超参数和交叉验证

训练数据分为 train data (train)和 test data(test),通常用一个比例来分9:1

train data 分成不同的fold来进行交叉验证 validate date(val)

假设train分成5个fold 1,2,3,4,5,分别用[1,2,3,4:5]、[5,2,3,4:1]、[1,5,3,4:2]、[1,2,5,4:3]、[1,2,3,5:4]进行交叉验证。

交叉验证来选择参数

得分函数(分类结果)

f(x,W)=每个类别的得分(有n个类别,则为n*1)

x:image 指图像(像素点个数*1)

W:parameters 权重参数(图像类别*像素点个数)

b:偏置项(bias),偏重一个类别

f(x,W)=Wx+b

神经网络的关键工作就是求W和b

损失函数(分类结果的好坏)

如果一个图像识别出来的结果是错的,我们需要告诉模型训练错了。

定义损失函数,函数值越大,训练效果越差。损失为0最好。

类似定义:sum(max(0,其他结果-正确结果+容忍度))

Softmax分类器

softmax的输出是概率,就是把分类结果转化为概率