目录
一. 安装NVIDIA驱动
1. 首先,查看NVIDIA驱动是否已安装
2.安装NVIDIA驱动
二.安装cuda
1. 查看NVIDIA版本对应的cuda版本
2. 选择CUDA版本(上限原则)
3. 安装cuda
4. 安装cndnn
三.安装tensorflow、pytorch深度学习框架
1. 安装tensorflow-gpu
2. 安装pytorch
四.参考
一. 安装NVIDIA驱动
1. 首先,查看NVIDIA驱动是否已安装
在终端输入以下命令,如果显示以下结果,说明NVIDIA驱动已经正常安装,否则,需要重新安装;
nvidia-smi
2.安装NVIDIA驱动
方法一:使用Ubuntu自带的镜像源安装
第一步:先在软件中搜索“软件和更新”,然后选择一个可用的镜像源,我选择的是清华的镜像源。我的选择如下:
第二步:选择源之后,还是在软件更新中,选择附加驱动,然后选择合适的驱动,应用更改就好,我本机选择的是nvidia-driver-455的驱动。
第三步:完成安装后,在终端输入 nvidia-smi,如果可以显示以下结果,恭喜你,安装NVIDIA驱动成功啦。
方法二:下载NVIDIA官方驱动
第一步:进入NVIDIA官方下载与之匹配的驱动: /geforce/drivers/ ,下图是我本机驱动匹配的信息。点击“开始搜索”,进入NVIDIA驱动下载界面。
第二步:点击获取下载,下载驱动,可以选择第一个最新版本的驱动进行下载安装。我本机选择下载的版本是455.38。
第三步:进入下载好的NVIDIA驱动的路径,开始安装NVIDIA驱动,执行以下命令进行安装。
sudo sh NVIDIA-Linux-x86_64-455.38.run
第四步:验证是否安装成功
完成安装后,在终端输入 nvidia-smi,如果可以显示以下结果,恭喜你,安装NVIDIA驱动成功。
二.安装cuda
1. 查看NVIDIA版本对应的cuda版本
进入该网址查看:/cuda/cuda-toolkit-release-notes/index.html ,如下图所示;
2. 选择CUDA版本(上限原则)
如上图所示,Ubuntu的显卡驱动版本为455.38,可以支持安装CUDA11.1.1update 1。有一个重要的原则:上限原则,即高版本可以兼容低版本(我本机的NVIDIA驱动支持安装CUDA11.1.1 update 1,所以我原则上可以安装CUDA11.1.1 update 1,及以下的任何一种cuda版本,也就是说,我不仅可以装CUDA11.1.1 update 1,还可以装CUDA10.0,CUDA9.2等,但不能安装CUDA 11.1.1 update 1以上的版本,这是由于受硬件的限制。这可以形象的理解为:一个可以挑100公斤重担的人,正常情况下他可以挑100公斤及100公斤以下的任何重量的物体。但不能挑超过100公斤物体。)
3. 安装cuda
第一步:进入cuda下载页面:/CUDA-toolkit-archive
第二步:安装cuda10.0:下载deb文件:/cuda-10.0-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=deblocal
第三步:文件大小1.6GB,下载速度还是挺快的,下载完成后,进入下载目录,然后在终端输入以下命令:
sudo dpkg -i cuda-repo-ubuntu1804-10-0-local-10.0.130-410.48_1.0-1_amd64.debsudo apt-key add /var/cuda-repo-10-0-local-10.0.130-410.48_1.0-1/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda
第四步:如果发现本机已自动升级最新版本了,运行以下命令
sudo apt-get install cuda-10.0
第五步:CUDA安装完成后,添加环境变量
gedit ~/.bashrc
第六步:在文件最后添加
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64
${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
第七步:最后,添加的环境变量生效,执行以下命令
source ~/.bashrc
第八步:查看cuda是否安装成功!
方法一:在终端输入
nvcc -V
如果显示以下结果,则表明安装成功:
方法二:去安装目录下查看或在终端输入
cat /usr/local/cuda/version.txt
如果显示以下结果,则表明安装成功:
4. 安装cndnn
第一步:去官网下载/rdp/cudnn-archive,下载与cuda版本一致的cudnn版本。我下载的版本是cuDNN v7.6.5版本。
第二步:下载完成后,对文件进行解压,有一个cuda的文件夹,包括include 和 lib64,把里面的文件复制到/usr/local/cuda/里面相应的目录里:
sudo cp 解压地址/cuda/include/cudnn.h /usr/local/cuda/include/sudo cp 解压地址/cuda/lib64/libcudnn* /usr/local/cuda/lib64/然后给文件加读权限
第三步:然后给文件加读权限
sudo chmod a+x /usr/local/cuda/include/cudnn.h
sudo chmod a+x /usr/local/cuda/lib64/libcudnn*
第四步:更新网络链接
cd /usr/local/cuda/lib64/sudo chmod +r libcudnn.so.7.6.5 # 自己查看.so的版本
sudo ln -sf libcudnn.so.7.6.5. libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
第五步:查看cudnn是否安装好:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
第六步:显示如下结果,恭喜,说明cudnn安装好啦!
三.安装tensorflow、pytorch深度学习框架
1. 安装tensorflow-gpu
第一步:查看tensorflow-gpu对应的cuda版本:/install/source_windows
由于我本机NVIDIA驱动支持安装的是cuda11.1.1 update1,(我本机装的是cuda10.0),所以我可以装tensorflow-gpu的cuda11.1.1 update1及以下的任何一个cuda版本。
第二步:安装tensorflow-gpu=2.2.0,进入tensorflow对应的虚拟环境(前提是已安装好了anaconda),在终端输入以下命令:
#使用conda安装tensorflow-gpu,它会自动匹配要安装的cuda版本:cuda10.1,如下图所示conda install tensorflow-gpu==2.2.0
第三步:验证tensorflow-gpu是否安装成功
进入python编译环境,输入以下代码,如果输出结果是本机的GPU的信息和结果True(我的输出结果是: device (0): GeForce GTX 1080, Compute Capability 6.1 True),表示GPU可用:
pythonimport tensorflow as tf
print(tf.test.is_gpu_available())
tf.test.is_gpu_available()
2. 安装pytorch
第一步:匹配要安装的pytorch版本:/get-started/locally/
第二步:在终端输入以下命令:
conda install pytorch torchvision torchaudio cudatoolkit=10.1 -c pytorch
第三步:验证pytorch是否安装成功,进入python编译环境,输入以下代码,如果输出结果是cuda,表示GPU可用,如果输出cpu,表示GPU不可以用:
import torch as tdevice = t.device('cuda' if t.cuda.is_available() else 'cpu')
print(device)
四.参考
/momaojia/article/details/104435468#commentBox