ubuntu18.04深度学习环境配置

前言

为跑代码方便,实验室电脑一般都用ubuntu系统,但无奈买来的电脑都是预装windows,所以需要重装系统,然后再配置一系列的环境。走一遍流程总要有些坑,下次再重复安装总是隐约记得但又会再踩坑,为了之后提高效率,这次把整个流程记录下来,以后用着也方便。

1. ubuntu18.04安装

现在ubuntu已经出到了21版本,一般安装LTS(长期支持)版本就没啥问题,但为了兼容一些老环境、老配置,这里选18版本的稳妥一些。

镜像在官网下载:https://ubuntu.com/#download

我用的是18.04.6桌面版,可以在这里下载:
链接:https://pan.baidu.com/s/1p4kAtoaZSzxJa2VqtjuFmg
提取码:vwj5

下载之后,要制作启动盘,用u盘或光盘都可,这里用u盘制作

制作工具用 UltraISO软碟通,下载之后,准备好一个空u盘(制作启动盘需要格式化u盘),8g的就够,然后按照这个来就行
https://jingyan.baidu.com/article/154b46311befea28ca8f41ae.html

之后就是关机,插上u盘,开机进入bios,选择u盘启动那一项,按照引导安装就行。(因为是重装系统,直接覆盖原系统,所以分区、存储那些配置都按照默认的来就行,记得选择覆盖原系统就行)

2. nvidia显卡驱动

深度学习网络都离不开显卡,安装显卡驱动算是最重要的一步。

首先,有个准备工作,禁用BIOS中的secure boot(需要重启一下进BIOS)。

进入系统后,禁用默认使用的开源显卡驱动nouveau:

  • 创建文件 sudo vim /etc/modprobe.d/blacklist-nouveau.conf
  • 写入
    blacklist nouveau
    options nouveau modeset=0
  • 使禁用生效 sudo update-initramfs -u
  • 检验是否生效(没有输出就是生效了) lsmod | grep nouveau

想使用nvidia的独立显卡,就需要安装对应的显卡驱动,所以要知道自己显卡的信息,确定驱动版本。

终端输入:ubuntu-drivers devices
在这里插入图片描述
可以看到推荐安装的是 nvidia-driver-470,直接安装就可。

sudo apt update
sudo apt install nvidia-driver-470

安装后重启一下,终端输入:nvidia-smi
在这里插入图片描述
如图安装成功。

其实也可以去nvidia官网下载对应版本的驱动,除去官网的版本可能更新一点之外,其实都差不多,上边的方法更简单。

具体过程参考:
https://zhuanlan.zhihu.com/p/59618999
https://blog.csdn.net/new_delete_/article/details/81544438

!!踩坑!!:之前安装显卡驱动后,再重启会显示驱动的版本和系统不一致,这是由于linux内核自动更新导致的,所以为了方便起见,避免之后出现问题,在显卡驱动安装后,先设置禁止系统内核更新,之后再重启查看显卡驱动

查看一下在使用的内核版本 uname -a
在这里插入图片描述
然后 sudo apt-mark hold linux-image-5.4.0-84-generic

dpkg --get-selections |grep linux-image ,显示hold就可以了
在这里插入图片描述
然后再禁止一下软件更新(如果不用图形界面,软件的更新其实没啥用)
在这里插入图片描述
参考:https://www.cnblogs.com/111testing/p/13668275.html

3. 安装anaconda3

接下来就是安装python以及cuda这些实验环境了,由于后续想在虚拟环境中配置对应工程的环境,用conda还是方便些。
安装anaconda,基本的过程就这样:https://blog.csdn.net/qq_15192373/article/details/81091098

注意:anaconda的版本建议新一点,我用老版本安装后,后续安装pytorch时候,装cuda11.3版本死活找不到源,后来升级了一下conda版本就可以了,所以建议一开始就安装新一点的版本。

我用的这个版本,没有问题。
在这里插入图片描述

4. 安装pytorch(含cuda、cudnn)

新建一个conda环境,python版本按需安装,一般3.6就够用了。 https://blog.csdn.net/omg_orange/article/details/98181099

进入环境,开始安装pytorch
在官网 https://pytorch.org/ 找到安装指令,前边安装显卡驱动时候显示cuda11.4,这是驱动支持的最高cuda版本,可以向下兼容,下载11.3就可以。
在这里插入图片描述
安装:conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

这里一般会出现网络连接不上,找不到资源等问题,网上有很多换conda源的,感觉某些资源可以在清华源这种找到,但是一些较新的资源还是没有,所以建议安装较新版本的anaconda,之后直接按照这个指令安装就行,可能会很慢,可以科学上网提提速。

安装完成后,conda list 可以查看到
在这里插入图片描述

写个python程序测试一下

#test_gpu.py
import torch
flag = torch.cuda.is_available()
print(flag)
ngpu= 1
# Decide which device we want to run on
device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")
print(device)
print(torch.cuda.get_device_name(0))
print(torch.rand(3, 3).cuda())

在这里插入图片描述


版权声明:本文为Yuan_mingyu原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
THE END
< <上一篇
下一篇>>