机器学习中的数学基础_七月算法4月机器学习班第1次课程笔记

2023年4月9日下午10:58 • 机器学习

2016/5/8 星期日 12:36

	desc
目标函数选择	基尼系数，熵（条件熵，交叉熵），分类误差率都可以作为目标函数
用凸函数的方法证明 KL距离一定大于0	D(p\|\|q) = Σplog(p/q) = -Σplog(q/p) 因为 -log 是凸函数，且Σp=1，所以上式 >= -log(Σp·q/p) = -log(Σq) = -log(1) = 0 所以相对熵（KL散度）一定是大于零的
古典概率	特点就是：都要将全部的情况求出来，作为分母这是生日悖论的数学模型与抽屉原理的；类似
关于描述贝叶斯派的思路
二项分布的产生，基于两点分布	应用
泊松分布的来源	对于麦克劳林展开式等号两边同时除以 e^-x 那么每一项都是泊松分布的密度函数的一个取值所以泊松分布密度函数累积和是1

泊松分布	如何理解泊松分布拿例子当成定义：就是单位之间内，平均来的人数为 m，那么想问的是：那么这单位时间内来的人数分别为 1,2,3，等等各个的概率？平均来m个人，那么其实P(X=m) 的也不是最大的，即为：也就是说在已知期望均值的情况下，问在各个数值上的概率 # 条件是每次发生不影响下一次发生，即相互独立
sigmoid 函数在求导上的特点	f(x)' = f(x)·(1 - f(x))
无人驾驶汽车	是地区相关的，即要 input，这个城市各个地段的信息不能超过这个区域比如北京的无人驾驶车就不能去上海
ml 可以以性能指标作为目标	比如：比赛中击败对手的百分比
LR 不适合曲线拟合	LR 应该是一个分类的，别想着他来做回归了因为它使用了 sigmoid 非线性函数，只不过由于输出是概率，所以它能用于排序，但并不代表它能用于曲线拟合
曲线拟合	多项式回归线性回归回归树回归神经网络
无监督学习的类别	聚类，关联规则
几何概率	A 在 0~0.8 之间，B在 0~0.2 之间，均匀分布，各自生成一个数，问 B>A 的概率建立 (X, Y) 坐标，从而能用二维面积来表示关系
如何证明 lim(sinx/x)=1	借助这个图我们有：sinx < x < tanx 数学处理：两边处理 sinx 1 < x/sinx < 1/cosx cosx < sinx/x <1 lim cosx = 1 所以 lim sinx/x = 1 作用
寒老师说	1. 如果不看原理与公式，那么只能做 baseline 2. 如果你胆敢说自己懂一个算法一定是问这个损失函数 3. 感觉自己似乎是在开始积累证明了一遇到证明，就想。。。积累了