Post

Mise en place d'un environnement de développement pour l'apprentissage automatique

Cet article traite de la méthode de mise en place d'un environnement de développement, qui peut être considérée comme la première étape pour étudier l'apprentissage automatique sur une machine locale. Tout le contenu a été rédigé sur la base d'Ubuntu 20.04 LTS avec une carte graphique NVIDIA Geforce RTX 3070.

Mise en place d'un environnement de développement pour l'apprentissage automatique

Aperçu

Cet article traite de la méthode de mise en place d’un environnement de développement, qui peut être considérée comme la première étape pour étudier l’apprentissage automatique sur une machine locale. Tout le contenu a été rédigé sur la base d’Ubuntu 20.04 LTS avec une carte graphique NVIDIA Geforce RTX 3070.

  • Pile technologique à mettre en place
    • Ubuntu 20.04 LTS
    • Python 3.8
    • pip 21.0.1
    • jupyter
    • matplotlib
    • numpy
    • pandas
    • scipy
    • scikit-learn
    • CUDA 11.0.3
    • cuDNN 8.0.5
    • Frameworks d’apprentissage profond (il est recommandé de n’en installer qu’un seul par environnement)
      • PyTorch 1.7.1
      • TensorFlow 2.4.0

Tableau comparatif avec le nouveau guide de mise en place d’un environnement de développement pour l’apprentissage automatique

Bien que cela fasse environ 3 ans et demi depuis la publication de cet article sur le blog, son contenu reste largement valable, à l’exception de quelques détails comme les versions des packages et l’annonce des pilotes open source NVIDIA. Cependant, en construisant un nouvel environnement de développement après avoir acheté un nouveau PC à l’été 2024, il y a eu quelques changements, j’ai donc rédigé un nouveau guide de mise en place d’un environnement de développement. Les différences sont résumées dans le tableau ci-dessous.

DifférenceCet article (version 2021)Nouvel article (version 2024)
Distribution LinuxBasé sur UbuntuApplicable à d’autres distributions comme Fedora/RHEL/Centos,
Debian, openSUSE/SLES en plus d’Ubuntu
Méthode de mise en place de l’environnementEnvironnement virtuel Python utilisant venvEnvironnement basé sur des conteneurs Docker
utilisant NVIDIA Container Toolkit
Installation du pilote graphique NVIDIAOO
Installation directe de CUDA et cuDNN
sur le système hôte
O (Utilisation du gestionnaire de paquets Apt)X (Utilisation d’images pré-installées fournies par NVIDIA
sur Docker Hub, donc pas besoin de le faire manuellement)
PortabilitéNécessité de reconstruire l’environnement
de développement à chaque transfert vers un autre système
Basé sur Docker, donc possibilité de construire facilement
une nouvelle image avec le Dockerfile préparé ou de
porter facilement l’image existante (à l’exception des
volumes supplémentaires ou des configurations réseau)
Utilisation de bibliothèques d’accélération GPU
supplémentaires autres que cuDNN
XIntroduction de CuPy, cuDF, cuML, DALI
Interface Jupyter NotebookJupyter Notebook (classique)JupyterLab (Nouvelle génération)
Configuration du serveur SSHNon abordéInclut une configuration de base du serveur SSH dans la partie 3

Si vous souhaitez utiliser un environnement virtuel Python comme venv plutôt que Docker, cet article reste toujours valable, vous pouvez donc continuer à le lire. Si vous voulez profiter des avantages de l’adoption des conteneurs Docker tels qu’une haute portabilité, si vous prévoyez d’utiliser une distribution Linux autre qu’Ubuntu comme Fedora, si vous utilisez un environnement avec une carte graphique NVIDIA et souhaitez utiliser des bibliothèques d’accélération GPU supplémentaires comme CuPy, cuDF, cuML, DALI, ou si vous voulez accéder à distance via la configuration SSH et JupyterLab, je recommande également de consulter le nouveau guide.

0. Vérifications préalables

  • L’utilisation de Linux est recommandée pour l’étude de l’apprentissage automatique. Bien que ce soit possible sous Windows, cela peut entraîner une perte de temps sur de nombreux petits aspects. Il est plus pratique d’utiliser la dernière version LTS d’Ubuntu. Les pilotes propriétaires sont également installés automatiquement pour plus de commodité, et comme il y a beaucoup d’utilisateurs, la plupart des documents techniques sont rédigés sur la base d’Ubuntu.
  • En général, Python est préinstallé sur la plupart des distributions Linux, y compris Ubuntu. Cependant, si Python n’est pas installé, vous devez d’abord l’installer avant de suivre cet article.
  • Si vous prévoyez d’étudier l’apprentissage automatique sur une machine locale, il est préférable de préparer au moins un GPU. Bien que le prétraitement des données soit possible avec le CPU, la différence de vitesse d’apprentissage entre le CPU et le GPU devient écrasante à mesure que la taille du modèle augmente (en particulier dans le cas de l’apprentissage profond).
    • Pour l’apprentissage automatique, il n’y a en réalité qu’un seul choix de fabricant de GPU. Vous devez utiliser un produit NVIDIA. NVIDIA est une entreprise qui a beaucoup investi dans le domaine de l’apprentissage automatique, et presque tous les frameworks d’apprentissage automatique utilisent la bibliothèque CUDA de NVIDIA.
    • Si vous prévoyez d’utiliser un GPU pour l’apprentissage automatique, vous devez d’abord vérifier si le modèle de carte graphique que vous souhaitez utiliser est compatible avec CUDA. Vous pouvez vérifier le nom du modèle du GPU actuellement installé dans votre ordinateur en utilisant la commande uname -m && cat /etc/*release dans le terminal. Trouvez le nom du modèle correspondant dans la liste des GPU sur le lien, puis vérifiez la valeur Compute Capability. Cette valeur doit être d’au moins 3.5 pour pouvoir utiliser CUDA.
    • Les critères de sélection du GPU sont bien résumés dans l’article suivant. C’est un article que l’auteur met constamment à jour.
      Which GPU(s) to Get for Deep Learning
      L’article A Full Hardware Guide to Deep Learning écrit par la même personne est également très utile. Pour référence, la conclusion de l’article ci-dessus est la suivante :

      The RTX 3070 and RTX 3080 are mighty cards, but they lack a bit of memory. For many tasks, however, you do not need that amount of memory.
      The RTX 3070 is perfect if you want to learn deep learning. This is so because the basic skills of training most architectures can be learned by just scaling them down a bit or using a bit smaller input images. If I would learn deep learning again, I would probably roll with one RTX 3070, or even multiple if I have the money to spare. The RTX 3080 is currently by far the most cost-efficient card and thus ideal for prototyping. For prototyping, you want the largest memory, which is still cheap. With prototyping, I mean here prototyping in any area: Research, competitive Kaggle, hacking ideas/models for a startup, experimenting with research code. For all these applications, the RTX 3080 is the best GPU.

Si vous avez satisfait à toutes les conditions mentionnées ci-dessus, commençons la mise en place de l’environnement de travail.

1. Création du répertoire de travail

Ouvrez un terminal et modifiez le fichier .bashrc pour enregistrer une variable d’environnement (la commande suit le prompt $).
Tout d’abord, ouvrez l’éditeur nano avec la commande suivante (vim ou tout autre éditeur convient également).

1
$ nano ~/.bashrc

Ajoutez le contenu suivant à la dernière ligne. Vous pouvez changer le chemin entre guillemets si vous le souhaitez.
export ML_PATH="$HOME/ml"

Appuyez sur Ctrl+O pour sauvegarder, puis sur Ctrl+X pour quitter.

Maintenant, exécutez la commande suivante pour appliquer la variable d’environnement.

1
$ source ~/.bashrc

Créez le répertoire.

1
$ mkdir -p $ML_PATH

2. Installation du gestionnaire de paquets pip

Il existe plusieurs façons d’installer les paquets Python nécessaires pour l’apprentissage automatique. Vous pouvez utiliser une distribution Python scientifique comme Anaconda (méthode recommandée pour le système d’exploitation Windows), ou vous pouvez utiliser pip, l’outil de packaging natif de Python. Ici, nous utiliserons la commande pip dans le shell bash de Linux ou macOS.

Vérifiez si pip est installé sur votre système avec la commande suivante.

1
2
3
4
5
6
$ pip3 --version

Commande 'pip3' introuvable, mais peut être installée avec :

sudo apt install python3-pip

Si vous voyez ceci, cela signifie que pip n’est pas installé sur votre système. Installez-le en utilisant le gestionnaire de paquets de votre système (ici apt) (si un numéro de version apparaît, cela signifie qu’il est déjà installé, vous pouvez donc sauter cette commande).

1
$ sudo apt install python3-pip

Maintenant, pip est installé sur votre système.

3. Création d’un environnement virtuel indépendant (recommandé)

Pour créer un environnement virtuel (pour éviter les conflits de versions de bibliothèques avec d’autres projets), installez venv.

1
$ sudo apt install python3-venv

Ensuite, créez un environnement Python indépendant comme suit. La raison de faire cela est d’éviter les conflits entre les versions de bibliothèques nécessaires pour chaque projet, donc vous devez créer un nouvel environnement virtuel et construire un environnement indépendant chaque fois que vous commencez un nouveau projet.

1
2
$ cd $ML_PATH
$ python3 -m venv --system-site-packages ./(nom de l'environnement)

Pour activer cet environnement virtuel, ouvrez un terminal et entrez la commande suivante.

1
2
$ cd $ML_PATH
$ source ./(nom de l'environnement)/bin/activate

Après avoir activé l’environnement virtuel, mettez à jour pip dans l’environnement virtuel.

1
(env) $ pip install -U pip

Plus tard, pour désactiver l’environnement virtuel, utilisez la commande deactivate. Lorsque l’environnement est activé, tout paquet que vous installez avec la commande pip sera installé dans cet environnement isolé et Python utilisera ces paquets.

3′. (Si vous ne créez pas d’environnement virtuel) Mise à jour de la version de pip

Lors de l’installation de pip sur le système, vous téléchargez et installez un fichier binaire du serveur miroir de la distribution (ici Ubuntu), mais ce fichier binaire est généralement en retard sur la mise à jour et n’est souvent pas la dernière version (dans mon cas, la version 20.3.4 a été installée). Pour utiliser la dernière version de pip, exécutez la commande suivante pour installer (ou mettre à jour si déjà installé) pip dans le répertoire personnel de l’utilisateur.

1
2
3
4
5
$ python3 -m pip install -U pip

Collecting pip
(omis)
Successfully installed pip-21.0.1

Vous pouvez voir que pip a été installé dans la version 21.0.1, qui est la dernière version au moment de la rédaction de cet article. À ce moment, pip installé dans le répertoire personnel de l’utilisateur n’est pas automatiquement reconnu par le système, donc vous devez l’enregistrer comme variable d’environnement PATH pour que le système puisse le reconnaître et l’utiliser.

Ouvrez à nouveau le fichier .bashrc avec un éditeur.

1
$ nano ~/.bashrc

Cette fois, trouvez la ligne commençant par export PATH=. S’il n’y a pas de chemin écrit après, ajoutez simplement le contenu comme vous l’avez fait à l’étape 1. S’il y a déjà d’autres chemins enregistrés, ajoutez le contenu après en utilisant deux-points.
export PATH="$HOME/.local/bin"
export PATH="(chemin existant):$HOME/.local/bin"

La mise à jour de pip système par une méthode autre que le gestionnaire de paquets système peut causer des problèmes en raison de conflits de version. C’est pourquoi nous installons pip séparément dans le répertoire personnel de l’utilisateur. Pour la même raison, il est préférable d’utiliser la commande python3 -m pip au lieu de la commande pip pour utiliser pip, sauf dans un environnement virtuel.

4. Installation des paquets pour l’apprentissage automatique (jupyter, matplotlib, numpy, pandas, scipy, scikit-learn)

Installez tous les paquets nécessaires et leurs dépendances avec la commande pip suivante.
Dans mon cas, j’utilise venv, donc j’ai simplement utilisé la commande pip, mais si vous n’utilisez pas venv, il est recommandé d’utiliser la commande python3 -m pip comme mentionné précédemment.

1
2
3
4
5
6
(env) $ pip install -U jupyter matplotlib numpy pandas scipy scikit-learn

Collecting jupyter
  Downloading jupyter-1.0.0-py2.py3-none-any.whl (2.7 kB)
Collecting matplotlib
(suite omise)

Si vous avez utilisé venv, enregistrez un noyau pour Jupyter et donnez-lui un nom.

1
(env) $ python3 -m ipykernel install --user --name=(nom du noyau)

Désormais, pour exécuter Jupyter, utilisez la commande suivante.

1
(env) $ jupyter notebook

5. Installation de CUDA & cuDNN

5-1. Vérification des versions nécessaires de CUDA & cuDNN

Vérifiez les versions de CUDA prises en charge sur la documentation officielle de PyTorch.
Vérification des versions de CUDA compatibles avec PyTorch
Pour la version 1.7.1 de PyTorch, les versions de CUDA prises en charge sont 9.2, 10.1, 10.2, 11.0. Pour les GPU NVIDIA série 30, CUDA 11 est nécessaire, donc nous savons que la version 11.0 est nécessaire.

Vérifiez également la version de CUDA nécessaire dans la documentation officielle de TensorFlow 2.
Vérification des versions de CUDA compatibles avec TensorFlow 2
Pour la version 2.4.0 de TensorFlow, nous avons confirmé que CUDA version 11.0 et cuDNN version 8.0 sont nécessaires.

Dans mon cas, j’utilise parfois PyTorch et parfois TensorFlow 2, donc j’ai vérifié les versions de CUDA compatibles avec les deux packages. Vous devez vérifier les exigences du package dont vous avez besoin et vous y conformer.

5-2. Installation de CUDA

Accédez à CUDA Toolkit Archive, puis sélectionnez la version que vous avez vérifiée précédemment. Dans cet article, nous sélectionnons CUDA Toolkit 11.0 Update1.
CUDA 11.0 Update 1
Maintenant, sélectionnez la plateforme et le type d’installateur correspondants, puis suivez les instructions qui apparaissent à l’écran. À ce moment, il est préférable d’utiliser le gestionnaire de paquets du système pour l’installateur si possible. Ma méthode préférée est deb (network).
Sélection de la plateforme CUDA
Installation de CUDA

Exécutez les commandes suivantes pour installer CUDA.

1
2
3
4
5
6
$ wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
$ sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
$ sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/7fa2af80.pub
$ sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/ /"
$ sudo apt update
$ sudo apt install cuda-toolkit-11-0 cuda-drivers

Si vous avez l’œil, vous aurez remarqué que la dernière ligne est légèrement différente des instructions affichées dans l’image. Si vous entrez simplement cuda pour l’installation réseau comme indiqué dans l’image, la version la plus récente, 11.2, sera installée, ce qui n’est pas ce que nous voulons. Vous pouvez voir plusieurs options de méta-paquets dans le guide d’installation Linux de CUDA 11.0. Ici, nous avons modifié la dernière ligne pour spécifier l’installation du paquet CUDA Toolkit en version 11.0 et permettre la mise à jour automatique du paquet de pilotes.

5-3. Installation de cuDNN

Installez cuDNN comme suit.

1
2
$ sudo apt install libcudnn8=8.0.5.39-1+cuda11.0
$ sudo apt install libcudnn8-dev=8.0.5.39-1+cuda11.0

6. Installation de PyTorch

Si vous avez créé un environnement virtuel à l’étape 3, procédez avec l’environnement virtuel que vous allez utiliser activé. Si vous n’avez pas besoin de PyTorch, vous pouvez sauter cette étape.
Accédez au site web de PyTorch, sélectionnez la version de PyTorch à installer (Stable), le système d’exploitation (Linux), le package (Pip), le langage (Python), CUDA (11.0) et suivez les instructions qui apparaissent à l’écran.
Installation de PyTorch

1
(env) $ pip install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio===0.7.2 -f https://download.pytorch.org/whl/torch_stable.html

Pour vérifier si PyTorch a été correctement installé, lancez l’interpréteur Python et exécutez les commandes suivantes. Si un tenseur est retourné, c’est un succès.

1
2
3
4
5
6
7
8
9
10
11
12
(env) $ python3
Python 3.8.5 (default, Jul 28 2020, 12:59:40) 
[GCC 9.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import torch
>>> x = torch.rand(5, 3)
>>> print(x)"
tensor([[0.8187, 0.5925, 0.2768],
        [0.9884, 0.8298, 0.8553],
        [0.6350, 0.7243, 0.2323],
        [0.9205, 0.9239, 0.9065],
        [0.2424, 0.1018, 0.3426]])

Pour vérifier si le pilote GPU et CUDA sont activés et disponibles, exécutez la commande suivante.

1
2
>>> torch.cuda.is_available()
True

7. Installation de TensorFlow 2

Si vous n’avez pas besoin de TensorFlow, vous pouvez ignorer cette étape.
Si vous avez installé PyTorch dans un environnement virtuel à l’étape 6, désactivez cet environnement virtuel, puis revenez aux étapes 3 et 4 pour créer et activer un nouvel environnement virtuel avant de continuer. Si vous avez sauté l’étape 6, vous pouvez simplement continuer.
Installez TensorFlow comme suit.

1
(env2) $ pip install --upgrade tensorflow

Pour vérifier si TensorFlow a été correctement installé, exécutez la commande suivante. Si le nom du GPU s’affiche et qu’un tenseur est retourné, c’est un succès.

1
2
3
4
5
6
(env2) $ python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"

2021-02-07 22:45:51.390640: I tensorflow/stream_executor/platform/default/dso_loader.cc:49] Successfully opened dynamic library libcudart.so.11.0
(omis)
2021-02-07 22:45:54.592749: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1406] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 6878 MB memory) -> physical GPU (device: 0, name: GeForce RTX 3070, pci bus id: 0000:01:00.0, compute capability: 8.6)
tf.Tensor(526.1059, shape=(), dtype=float32)
This post is licensed under CC BY-NC 4.0 by the author.