一个关于创建Azure虚拟机、挂载硬盘、安装NVIDA显卡驱动与CUDA、创建用户的教程
A tutorial to teach you how to create an Azure VM for deep learning, mount the hard drivers, install NVIDIA GPU driver and CUDA and CUDNN, and create user accounts.
一共有5.5个部分
- A. 创建微软Azure深度学习虚拟机
- B. 硬盘挂载
- C. 安装CUDA
- D. 安装CUDNN
- (D+E)/2. 修改/data0权限为777(/data0为本虚拟机用户大型数据存储文件夹)
- E. 创建用户
可以参考官方文档
For English version, please see the offical document here
输入命令1:
sudo fdisk -l
输入命令2:
df -lh
可见待挂载的硬盘为/dev/sdc
和/dev/sdd
,此处以/dev/sdc
为例;本教程不对硬盘进行分区,直接格式化;可见待挂载的硬盘为/dev/sdc
和/dev/sdd
,此处以/dev/sdc
为例;本教程不对硬盘进行分区,直接格式化; mkfs
命令用来在特定的分区创建linux文件系统,常见的文件系统有ext2, ext3, ext4, vfat
输入命令:
sudo mkfs.ext4 /dev/sdc
参见官方文档
创建文件夹/home/users
(此文件夹用于创建本虚拟机用户)作为硬盘挂载的文件夹(此处为示例,可将硬盘挂载在其他文件夹下)
输入命令:
sudo mkdir /home/users
将/dev/sdc
挂载在/home/users
下
输入命令:
sudo mount /dev/sdc /home/users
输入命令
df -h
打开/etc/fstab并进行修改
输入命令查看磁盘的UUID(自动挂载需使用磁盘UUID,否则重启会造成错误,e.g. 对于/dev/sdc
,查看得知/dev/sdc: UUID="565d6e94-864f-48de-95d2-87d1ac282416" TYPE="ext4"
)
blkid
输入命令,打开/etc/fstab
文件:
sudo nano /etc/fstab
在文件末尾加入
UUID=565d6e94-864f-48de-95d2-87d1ac282416 /home/users ext4 defaults 0 0
输入命令:
sudo reboot
输入命令:
lspci | grep -i nvidia
输入命令:
ubuntu-drivers devices
或许提示Command 'ubuntu-drivers' not found, but can be installed with: sudo apt install ubuntu-drivers-common
则首先
sudo apt-get update
然后
sudo apt install ubuntu-drivers-common
再运行
ubuntu-drivers devices
输入命令:
sudo ubuntu-drivers autoinstall
输入命令:
sudo reboot
1. 参阅NVIDIA官网
输入命令:
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
sudo sh cuda_10.1.243_418.87.00_linux.run
(参考https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#post-installation-actions 中的7. Post-installation Actions)
(亦可参考如下网址设置system-wide的环境变量 https://www.pugetsystems.com/labs/hpc/How-To-Install-CUDA-10-1-on-Ubuntu-19-04-1405/ )
输入命令打开bashrc
nano .bashrc
在bashrc中添加以下两句话
export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
输入命令
source .bashrc
1. 前往官方网站下载
输入命令
cp cudnn-10.1-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.1-linux-x64-v7.6.5.32.tgz
tar -xvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
输入命令
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
输入命令
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
输入命令
sudo chmod 777 /data0
输入命令
sudo groupadd normalusers
输入命令
sudo useradd -g normalusers -d /home/users/wangad -m wangad
输入命令
sudo passwd wangad