【笔记】机器学习 – 李宏毅 — Explainable ML 可解释性机器学习

2023年4月10日上午2:03 • 机器学习

课程笔记

前言

两种可解释性：
局部解释：为什么这种图是猫？
全局解释：猫是什么样子的？

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

为什么需要可解释机器学习？（打开黑盒）

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

一般的提升效果的方法就是一顿暴调参数，可解释性可以帮助我们更好地提升模型性能。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

其实人也是个黑盒（这个观点太6了）。
可解释机器学习的目标，不需要真正知道模型如何工作，只需要给出可信服的解释，让人满意就行。
对此还可以针对不同人的接受能力给出不同层次的解释。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

模型的可解释性和模型的能力之间有矛盾。
一些模型，比如线性模型，可解释性很好，但效果不佳。而深度网络，虽然能力一流，但缺乏可解释性。
我们的目标不是直接选择可解释性好的模型，而是让能力强的模型具有更好的解释性。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

同时具有强大能力和可解释性的，是决策树。
但决策树结构如果很复杂，那么可解释性也会很差。（森林）

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

局部解释

一个研究对象可以分成很多个部分，如何判断各部分对于决策的重要性？
可以通过修改或者删除这一部分来看看结果有多大的影响，如果影响很大，则这部分很重要。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

举例：

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

可以用saliency map来可视化，图中的白点就是偏导数的值。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

更多资料：

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

求导的局限性：比如鼻子长到一定程度，就可以确定这是一只大象，但是导数却是0，得出鼻子不重要这样的结论，明显是不对的。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

这个也可以被对抗攻击，

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

宝可梦和数码宝贝的例子：

分类的效果太好了，用saliency map分析后发现，关注点在图的边缘，为什么？

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

因为格式不一样，背景不同。。。其实程序并没有学会分类宝可梦和数码宝贝。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

全局解释

之前讲过，什么样的输入可以得到最好的分类结果，可以看到机器认为的居然是下面这样的一些图。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

可以通过加正则项，然后来使图像看起来更像数字。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

这样的话就有更多的超参数需要调了。。。。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

如果说输入先经过一个生成器，使得不管什么样的向量，都可以经生成器得到一个合理的图片，然后再对图片分类。
通过图片的类别，反推优化输入，这样会更好一些。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

得到的结果不错，

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

用另一个模型去做解释

可以用一个解释性更好的模型去模拟另一个模型的效果。
虽然线性模型不能完全模拟神经网络，但在局部上，模拟效果还是不错的。（LIME方法）

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

这个方法的局限是，选取的局部粒度的大小会影响模拟的效果。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

举例：

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

切分后，可以提取成一个向量，然后可以用线性模型拟合。通过权重的大小，判断各分块的重要性。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

如果是决策树模型来模拟的话，我们希望这个树不要太大，那么可以设置一个树的复杂度参数。

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

不过这个复杂度参数不能微分。（paper中有一种收集很多复杂度数据，然后求解的方法）

【笔记】机器学习 - 李宏毅 -- Explainable ML 可解释性机器学习

课程地址

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：【笔记】机器学习 – 李宏毅 — Explainable ML 可解释性机器学习 - Python技术站

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

机器学习第八周–决策树

上一篇 2023年4月10日上午1:59

sklearn机器学习的监督学习的各个模型主要调参参数

下一篇 2023年4月10日

《机器学习》西瓜书习题第 3 章

3.1 　　试析在什么情况下式 \((3.2)\) 中不必考虑偏置项 \(b\) . 　　书中有提到, 可以把 \(x\) 和 \(b\) 吸收入向量形式 \(\hat{w} = (w;b)\) .此时就不用单独考虑 \(b\) 了.　　其实还有很多情况不用, 比如说使用了 \(\mathrm{one-hot}\) 编码, 就可以不用考虑偏置项.　　更广泛的…

机器学习 2023年4月11日
000
《机器学习基石》—理解机器为什么能学习（一）

假设有一个罐子装满了橙色和绿色的球，为了估计罐子中橙色和绿色的比例，我们随机抓一把球，称为样本：其中，设罐子中橙色球的比例为μ，样本中橙色球比例为v，样本的大小为N，我们对真实分布μ和样本分布v的差异容忍度为ε，则有下面的不等式成立：也就是存在一个概率上界，只要我们保证样本容量N很大，就能使得“μ和v的差异大”这件事的概率是很小的。 2 对于一个假设…

机器学习 2023年4月12日
001
机器学习中的各种损失函数（Hinge loss，交叉熵，softmax）

SVM multiclass loss（Hinge loss）这是一个合页函数，也叫Hinge function，loss 函数反映的是我们对于当前分类结果的不满意程度。在这里，多分类的SVM，我们的损失函数的含义是这样的：对于当前的一组分数，对应于不同的类别，我们希望属于真实类别的那个分数比其他的类别的分数要高，并且最好要高出一个margin，这样才是安…

机器学习 2023年4月10日
000
机器学习工程师 – Udacity 项目 0: 预测你的下一道世界料理

第一步. 下载并导入数据 1.1 数据集：https://www.kaggle.com/c/whats-cooking/data 1.2 加载数据 # 导入依赖库 import json import codecs import pandas as pd import numpy as np import matplotlib.pyplot as plt %…

机器学习 2023年4月11日
000
机器学习的5种语言（选自info world）

摘要：机器学习目前炙手可热，本文搜集了Java、Python以及go等编程语言中常见且实用的开源机器学习工具，对机器学习感兴趣的开发者或者准备和机器学习打交道的数据科学家们不能错过了 [编者按] 机器学习似乎在一夜之间从默默无闻的小卒变成万众瞩目的焦点，关于机器学习的开源工具也越来越多，但是目前的挑战是，如何让对机器学习感兴趣的开发者和准备使用它的数据科学…

机器学习 2023年4月13日
000
机器学习-朴素贝叶斯原理及Python实现

机器学习-朴素贝叶斯原理及Python实现贝叶斯公式 P(A|B) = (P(B|A)P(A))/P(B) 举例：苹果10个，有2个黄色；梨10个，有6个黄色，求拿出一个黄色水果，是苹果的概率。代入公式： P(苹果|黄色) = (P(黄色|苹果)P(苹果))/P(黄色) P(黄色) = (2+6)/20 = 2/5 P(苹果) = 10/20 = 1/2…

机器学习 2023年4月13日
000
机器学习中的算法(2)-支持向量机(SVM)基础 – LeftNotEasy – 博客园

版权声明：本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用，但请注明出处，如果有问题，请联系wheeleast@gmail.com 前言：又有很长的一段时间没有更新博客了，距离上次更新已经有两个月的时间了。其中一个很大的原因是，不知道写什么好-_-，…

机器学习 2023年4月13日
000
机器学习入门的书单（数据挖掘、模式识别等一样）

（写在前面）昨天说写个机器学习书单，那今天就写一个吧。这个书单主要是入门用的，很基础，适合大二、大三的孩子们看看；当然你要是大四或者大四以上没看过机器学习也适用。无论是研究智能还是做其他事情，机器学习都是必须的。你看GFW都用机器学习了，咱是不是也得科普一下。（全文结构）其实，我想了想，学一门学科，列出一堆书，评论来评论去的，其实对初学者用处不大；他都不知…

机器学习 2023年4月10日
000

合作推广

合作推广

返回顶部