在deepin20.9中部署计算机视觉相关的环境
Easul Lv6

注意: 本篇文章是在 deepin20.9 下进行尝试的,deepin23.1 下的相关环境安装可以参考这篇文章

初始环境准备

如果安装了 deepin 准备的 nvidia 驱动,需要先处理一下这些驱动

折叠代码块BASH 复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# 删除 deepin 已安装的 nvidia 驱动
sudo apt-get autoremove nvidia-*
# 添加禁用 nouveau 的指令
sudo echo "
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off" >> /etc/modprobe.d/blacklist.conf
# 使更新生效
sudo chmod +x /etc/modprobe.d/blacklist.conf
sudo update-initramfs -u
# 重启系统
sudo reboot
# 重启后查看 nouveau 有没有在运行,没输出则禁用生效
lsmod | grep nouveau

相关软件准备

折叠代码块BASH 复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
# 1. 下载 nvidia 闭源驱动
# 通过如下命令查看显卡名称,相关信息如下
# *-display
# description: VGA compatible controller
# product: GM204GL [Quadro M4000] [10DE:13F1]
# vendor: NVIDIA Corporation [10DE]
# physical id: 0
# bus info: pci@0000:03:00.0
#
# 我这里的显卡是 Quadro M4000
sudo lshw -numeric -C display
cd ~/Downloads
# 故在驱动链接中的信息如下
# Product Type: NVIDIA RTX / Quadro
# Product Series: Quadro Series
# Product: Quadro M4000
# Operating System: Linux 64-bit
# Download Type: Production Branch
# Language: Chinese (Simplified)
#
# 最后下载的版本是 535.113.01
wget https://cn.download.nvidia.com/XFree86/Linux-x86_64/535.113.01/NVIDIA-Linux-x86_64-535.113.01.run -O nvidia-driver.run

# 2. 下载最新版 cuda
# 下载 linux 版本时,下载 ubuntu 的 20.04 的 runfile 包即可
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run -O cuda.run

# 3. 下载最新版 cudnn
# 我这里使用的是 cuda 12.2 ,故下载 cuDNN v8.9.5 for CUDA 12.x
# 由于下载需要使用 cookie ,故需要用浏览器下载
# 注: 由于 cudnn 在安装过程中可能会有问题,这里暂时先不记录

# 4. 安装 anaconda
wget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh -O anaconda.sh

具体安装步骤

折叠代码块BASH 复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
# CTRL + ALT + F2 进入 TTY 界面,登录 root 用户
# 关闭 lightdm
service lightdm stop

# 1. 安装驱动
# 进入刚才下载用户的 Downloads 目录
cd /home/用户名/Downloads
# 授予运行权限并下载
chmod +x nvidia-driver.run
./nvidia-driver.run
#########################################
# 安装过程中可能会有如下提示,可以参考如下选择方式
# 不会的默认也可以
#
#########################################
# Would you like to register the kernel module sources with DKMS?
# This will allow DKMS to automatically build a new module,
# if you install a different kernel later
# 选择 NO
#########################################
# Would you like to run the nvidia-xconfigutility to automatically
# update your x configuration so that the NVIDIA x driver will be
# used when you restart x? Any pre-existing x confile will be backed up
# 选择 YES
#########################################
# Nvidia's 32-bit compatibility libraries?
# 选择 NO
#########################################
#
# 安装完成后,重启系统
reboot
# 重启后使用如下命令查看驱动相关信息
nvidia-smi

# 2. 安装 cuda
# 现在在普通用户下安装即可
# 进入用户的 Downloads 目录
cd ~/Downloads
# 开始安装
sudo sh cuda.run
# 最开始进入之后,输入 accept 进入下一步
# 在安装核心组件的时候,由于 Driver 已经安装
# 在 Driver 上回车,去掉这个安装即可
# 然后移动到 Install 回车安装
# 安装完成,出现 Summary 即安装成功
# 然后修改 .bashrc
vim ~/.bashrc
# 添加如下内容,然后保存退出
#########################################
# cuda
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64
#########################################
# 重新加载环境变量
source ~/.bashrc
# 查看安装的 cuda 版本
nvcc --version

# 3. 安装 anaconda
# 进入用户的 Downloads 目录
cd ~/Downloads
# 开始安装软件,安装过程中按照提示进行即可
# 安装路径可以换到其他位置
sh anaconda.run
# 安装完成后,激活 conda 命令行终端为 bash
conda init bash
# 去掉激活命令行终端后,前边显示的 (base)
conda config --set auto_activate_base false

YOLOv5相关环境处理

折叠代码块BASH 复制代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# 创建一个虚拟环境
conda create -n yolov5 python=3.8 -y
# 激活虚拟环境
conda activate yolov5
# 下载相关 yolov5 源码
mkdir ~/workspace
cd ~/workspace
git clone https://github.com/ultralytics/yolov5
cd yolov5
# 安装相关依赖
pip install -r requirement.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
# 如果这里的相关依赖是在windows下用清华源安装的,
# 那么可能会有 torch.cuda.is_available() 为 False 的问题
# 这是因为清华源的错误
# windows下在虚拟环境的 Lib\site-packages 下删除 torch 相关的包
# linux下在虚拟环境的 lib/pythonx.x/site-packages 下删除 torch 相关的包
# 然后在如下链接里选择相应的 torch 安装命令,重新安装 torch 相关依赖即可
# https://pytorch.org/get-started/locally/#no-cuda-1
# 这里是在 linux 下的 CUDA 12.1 和 PyTorch Stable 2.1.0 下下载的
# 注意: 这里可以直接使用如下源链接格式来下载固定的PyTorch包
# --index-url 后边的 cu124 可以根据本机的cuda版本不同来更换
# pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124
pip3 install torch torchvision torchaudio

一些简单的命令

  • 查看GPU使用率

    折叠代码块BASH 复制代码
    1
    nvidia-smi | grep  Default | echo "GPU使用率为: "$(awk '{print $13;}')
  • 使用 python 命令来查看 GPU 的 设备id

    折叠代码块PYTHON 复制代码
    1
    2
    3
    4
    5
    6
    import torch

    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    if device.type == "cuda":
    device_id = torch.cuda.current_device()
    print("GPU device ID:", device_id)

相关参考

 评论
来发评论吧~
Powered By Valine
v1.5.2