Windows下利用MKL加速caffe，与openblas比较

2023年4月8日上午2:35 • Caffe

一、介绍：先简单Mark一下网上的介绍资料，弄清楚MKL是个啥，已经与openblas等的关系。

矩阵运算库blas, cblas, openblas, atlas, lapack, mkl之间有什么关系，在性能上区别大吗？摘自：https://www.zhihu.com/question/27872849
比较OpenBLAS，Intel MKL和Eigen的矩阵相乘性能。摘自：http://www.leexiang.com/the-performance-of-matrix-multiplication-among-openblas-intel-mkl-and-eigen

二、MKL使用：

之前的项目使用的是openblas，需要替换成MKL，然后测试不同库的效率。首先需要注意的是，这种换库，或者更新cudnn的版本，需要重新编译caffe。
具体步骤：

- STEP1：取消之前对openblas.lib静态库的依赖，然后删除openblas.dll（我为了避免是openblas还在起作用）。重新编译caffe的话，应该会在math_function.h中报错。

- STEP2：在网上下载MKL的库，官网地址：https://software.intel.com/en-us/mkl。这里我有点疑问，看某些教程说是下载parallel_studio_xe，我理解MKL集成在parallel_studio_xe里面了。因此下载两个都是OK的。

只下载MKL的话，VS中右键项目不会出现Intel Compile那个选项。但是我之后也没有用到过这个选项。

- STEP3：按照网上的教程：

三、效率比较：我的理解，MKL对GPU并没有太多的加速功能，对CPU的加速效果还是比较明显的，跑了一个行人结构化分析：

　　 Windows下利用MKL加速caffe，与openblas比较

　　前两次都是openblas的，最后是cudnn_6+MKL。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Windows下利用MKL加速caffe，与openblas比较 - Python技术站

Caffe 人工智能

赞 (0)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

caffe Solve函数

上一篇 2023年4月8日

Caffe学习五 conv_layer与im2col

下一篇 2023年4月8日

循环神经网络

TensorFlow深度学习笔记循环神经网络实践

转载请注明作者：梦里风林Github工程地址：https://github.com/ahangchen/GDLnotes欢迎star，有问题可以到Issue区讨论官方教程地址视频/字幕下载加载数据使用text8作为训练的文本数据集 text8中只包含27种字符：小写的从a到z，以及空格符。如果把它打出来，读起来就像是去掉了所有标点的wikipedia。 …

2023年4月7日
000
tensorflow与keras版本不匹配问题

https://blog.csdn.net/boosting1/article/details/102750995

Keras 2023年4月5日
000
module ‘tensorflow’ has no attribute ‘ConfigProto’/’Session’解决方法

因为tensorflow2.0版本与之前版本有所更新，故将代码修改即可： #原 config = tf.ConfigProto(allow_soft_placement=True) config = tf.compat.v1.ConfigProto(allow_soft_placement=True) #原 sess = tf.Session(config=…

tensorflow 2023年4月7日
000
PyTorch全连接ReLU网络

PyTorch全连接ReLU网络 1．PyTorch的核心是两个主要特征：一个n维张量，类似于numpy，但可以在GPU上运行搭建和训练神经网络时的自动微分/求导机制本文将使用全连接的ReLU网络作为运行示例。该网络将有一个单一的隐藏层，并将使用梯度下降训练，通过最小化网络输出和真正结果的欧几里得距离，来拟合随机生成的数据。 2.张量 2.1 热身: …

PyTorch 2023年4月8日
000
机器学习 —— 概率图模型（Homework: Exact Inference）

　　在前三周的作业中，我构造了概率图模型并调用第三方的求解器对器进行了求解，最终获得了每个随机变量的分布（有向图），最大后验分布（双向图）。本周作业的主要内容就是自行编写概率图模型的求解器。实际上，从根本上来说求解器并不是必要的。其作用只是求取边缘分布或者MAP，在得到联合CPD后，寻找联合CPD的最大值即可获得MAP，对每个变量进行边缘分布求取即可获得边缘…

机器学习 2023年4月16日
000
卷积神经网络

【39】为什么使用卷积？（Why convolutions?）

为什么使用卷积？（Why convolutions?）我们来分析一下卷积在神经网络中如此受用的原因，然后对如何整合这些卷积，如何通过一个标注过的训练集训练卷积神经网络做个简单概括。和只用全连接层相比，卷积层的两个主要优势在于参数共享和稀疏连接，举例说明一下。假设有一张32×32×3维度的图片，这是上节课的示例，假设用了6个大小为5×5的过滤器，输出维…

2023年4月5日
000
tensorflow

anaconda python3.7环境下tensorflow安装

环境是anaconda python 3.7+ cuda10.0 ,但是当前的 tensorflow支持的最高python版本为python3.6 https://pypi.org/project/tensorflow-gpu/#files 所以在安装完后需要创建python3.6的环境 conda create -n py36 python=3…

2023年4月6日
000
循环神经网络

RNN循环神经网络简介

1.RNN怎么来的？ 2.RNN的网络结构及原理 3.RNN的改进1：双向RNN 4.RNN的改进2：深层双向RNN 4.1 Pyramidal RNN 5.RNN的训练-BPTT 6.RNN与CNN的结合应用：看图说话 7.RNN项目练手 1.RNN怎么来的？循环神经网络的应用场景比较多，比如暂时能写论文，写程序，写诗，但是，（总是会有但是的），但是他们…

2023年4月8日
000

合作推广

合作推广

返回顶部