Ubuntu 16.04 + GTX 1080 Ti + CUDA 9.0 + Cudnn 7.1 安装配置

Download Ubuntu16.04:

  mirrors.aliyun.com/ubuntu-releases/16.04    |    or 18.04

CUDA与CUDNN版本对应关系,可参考该链接:

https://blog.csdn.net/qq_27825451/article/details/89082978

1. 安装显卡驱动

首先查看一下自己的电脑需要怎样的驱动,我们可以先到 http://www.nvidia.com/Download/index.aspx 查询下我们需要的是怎样的驱动,这里我的显卡是 GTX 1080 Ti,所以以此为例说明,勾选好对应的配置:

https://www.nvidia.cn/geforce/drivers/

 Ubuntu安装配置Tensorflow-GPU

点击search并下载驱动

打开terminal,卸掉系统原有驱动:

sudo apt-get remove --purge nvidia*

在安装新驱动前,禁用nouveau:

在终端中运行 lsmod | grep nouveau

若没有输出则nouveau已禁用;若有输出则说明nouveau正在运行,需要手动禁用:

sudo vim /etc/modprobe.d/blacklist-nouveau.conf

在该文件尾部输入以下内容:

blacklist nouveau 
options nouveau modeset=0

保存并关闭文件。

sudo reboot

在终端中执行:sudo update-initramfs -u

 

再次运行 lsmod | grep nouveau 检查nouveau是否禁用,若未禁用则重复上述操作。

关闭图形化界面:sudo service lightdm stop

        sudo apt-get remove nvidia-* 

按Ctrl + Alt + F1 进入字符终端页面,

进入驱动所在的目录,运行:

sudo chmod a+x NVIDIA-Linux-x86-64-xxx.run

 sudo ./NVIDIA-Linux-x86-64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files

安装完之后重启: sudo reboot

打开终端输入命令: nvidia-smi, nvidia-settings查看驱动安装状态:

 Ubuntu安装配置Tensorflow-GPU

 [sudo apt-get install nvidia-384]

2. 安装CUDA 9.0

https://developer.nvidia.com/cuda-downloads   https://developer.nvidia.com/cuda-toolkit-archive

sudo sh
cuda_9.0.176_384.81_linux.run

是否Accept EULA:Accpet

Install driver:Yes/No

Install OpenGL:No

Run nvidia_xconfig: No

Install Cuda Toolkit: Yes

Yes

Yes

Ubuntu安装配置Tensorflow-GPU

 

 

有如下信息 可以忽略:
***WARNING: Incomplete installation! This installation did not install
the CUDA Driver. A driver of version at least 384.00 is required for
CUDA 10.0 functionality to work.

To install the driver using this installer, run the following command, replacing with the name of this run file:

 

配置CUDA的环境变量:

sudo gedit ~/.bashrc

在文件尾部输入:

  1. export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH  
  2.   
  3. export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH  

运行source ~/.bashrc 使其生效

 

3. 配置 Cudnn

https://developer.nvidia.com/rdp/cudnn-archive

下载Cudnn并解压:

tar -zxvf cudnn-7.0-linux-x64-v3.0-prod.tgz

解压后会看到一个cuda文件夹,里面包含了include以及lib64两个子目录。我们需要做的就是将这两个字母里面的文件复制到cuda对应的安装目录。这里以cuda的安装目录为/usr/local/cuda/,这个目录下也会包含include/以及lib64/这两个文件夹,将之前目录的文件复制过来即可。

sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuDNN/cuda/lib64/* /usr/local/cuda/lib64/

 

这时候本来已经可以了,但是由于权限的原因原来的两个符号链接文件(libcudnn.so,libcudnn.so.7.0)已经失效了,直接编译便会报错,所以这时手动生成符号链接。

#下面的操作在/usr/local/cuda/lib64/目录下进行

sudo rm -rf libcudnn.so libcudnn.so.7.0#删除两个符号链接;

sudo ln -s libcudnn.so.7.0.64 libcudnn.so.7.0

sudo ln -s libcudnn.so.7.0 libcudnn.so

 

运行source ~/.bashrc 使其生效

如果出现下面问题:

/sbin/ldconfig.real:
/usr/local/cuda/lib64/libcudnn.so.7 is not a symbolic link

则参考如下解决方法,版本需对应安装的cudnn的相应版本(link:https://askubuntu.com/questions/1025928/why-do-i-get-sbin-ldconfig-real-usr-local-cuda-lib64-libcudnn-so-7-is-not-a):

sudo rm libcudnn.so

sudo ln libcudnn.so.7.0.5
libcudnn.so.7

sudo ln libcudnn.so.7 libcudnn.so

sudo ldconfig

Cudnn配置完毕

 

4. 安装Anaconda

根据环境下载对应的anaconda 软件,运行:

Sudo bash Anaconda3-5.1.0-Linux-x86_64.sh

安装完之后创建python虚拟环境:

conda create -n tensorflow pip python=2.7 #
or python=3.3, etc.

(根据需要选择合适的python版本)

 

5. 安装Tensorflow-gpu

https://pypi.tuna.tsinghua.edu.cn/simple     https://pypi.tuna.tsinghua.edu.cn/simple/tensorflow-gpu/

输入命令:source activate
tensorflow-gpu

pip install --ignore-installed --upgrade
tfBinaryURL

(我装的是tensorflow-gpu 1.10版本,把tfBinaryURL 替换如下

https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow_gpu-1.10.0-cp36-cp36m-linux_x86_64.whl

链接不好使~需要多试几次,tensorflow会自动下载安装

 

6. 缺少的一些包用pip安装:

Pip install
opencv-python

Pip install matplotlib,
etc