Utilisation du Datalab
Introduction
Pour les besoin des TP, nous aurons besoin des outils suivants :
- une base de données (PostrgeSQL)
- un outil pour communiquer avec cette base de données (cloudBeaver)
1 Principe
Les datalabs sont composés :
- d’une infrastructure cloud on premise (≠ cloud propriétaire : AWS, GCP, OVH… )
- i.e. hébergée dans les locaux de l’INSEE et du GENES
- avec des ressources est à votre disposition (CPU, GPU, RAM, Stockage)
- de l’application Onyxia
- elle offre une interface pour utiliser cette infrastructure pour lancer des services
- sans avoir à utiliser de commandes “complexes”
Lorsque vous en avez besoin, vous :
- réservez des ressources (en lançant des services)
- lancez vos programmes, calculs…
- sauvegardez votre code en utilisant Git
- exportez vos résultats vers le stockage objet S3
- libérez les ressources une fois que vous avez terminé
Pour vous aider, l’interface Onyxia vous permet de faire cela en quelques clics.
2 Lancement des services
Les datalabs de l’INSEE et du GENES proposent les services nécessaires.
2.1 Se connecter
Connectez-vous à l’une des 2 instances suivantes d’Onyxia :
-
- si besoin de créer un compte, utilisez votre mail ENSAI :
nom.prenom@eleve.ensai.fr
- si besoin de créer un compte, utilisez votre mail ENSAI :
Il est fortement recommandé d’utiliser en priorité le SSP Cloud qui est plus stable.
2.2 PostgreSQL
-
- Catalogue de services ➡️ Databases
Lorsque vous lancez le services, les paramètres de connexion à cette base de données sont affichés.
Une fois le service lancé, vous pouvez toujours accéder à ces paramètres via le bouton README.
-
- Hostname
- Port : 5432
- Database : defaultdb
- Username
- Password
Elles serviront pour vous connecter à cette base de données depuis le service cloudBeaver
2.3 CloudBeaver
Nous venons de créer un SGBD, nous avons maintenant besoin d’un outil de gestion pour s’y connecter et envoyer des requêtes.
-
- Collez username et password
Normalement la connexion à la base de données PostgreSQL est détectée automatiquement.
Si c’est le cas, elle apparait dans l’explorer à gauche qui contient la liste des connexions.
Dans cloudBeaver :
-
- cliquez sur le
+en haut à gauche ➡️ New connection ➡️ PostgreSQL
- cliquez sur le
-
- Hostname, Port, Database, Username, Password
Il faut maintenant ouvrir la connexion :
Enfin, ouvrez une fenêtre SQL pour saisir vos requêtes :
Vous pouvez lancer quelques requêtes simples pour vérifier que tout fonctionne.
SELECT 1;
SELECT NOW();
SELECT current_database();
SELECT version();3 Arrêt des services
Une fois le TP terminé, il est important de libérer les ressources réservées i.e. arrêter / mettre en pause vos services :
-
- par exemple dans
P:/Cours1A/UE3-Bases-de-donnees-relationnelles/tpx.sql - ou en téléchargeant depuis CloudBeaver le fichier sql (petit bouton avec un dossier et une flèche vers le bas)
- par exemple dans