Utilisation du Datalab

Lancer les services nécessaires pour les TP
Author

Ludovic Deneuville

Introduction

Pour les besoin des TP, nous aurons besoin des outils suivants :

  • une base de données (PostrgeSQL)
  • un outil pour communiquer avec cette base de données (cloudBeaver)

1 Principe

Les datalabs sont composés :

  • d’une infrastructure cloud on premise (≠ cloud propriétaire : AWS, GCP, OVH… )
    • i.e. hébergée dans les locaux de l’INSEE et du GENES
    • avec des ressources est à votre disposition (CPU, GPU, RAM, Stockage)
  • de l’application Onyxia
    • elle offre une interface pour utiliser cette infrastructure pour lancer des services
    • sans avoir à utiliser de commandes “complexes”

Lorsque vous en avez besoin, vous :

  • réservez des ressources (en lançant des services)
  • lancez vos programmes, calculs…
  • sauvegardez votre code en utilisant Git
  • exportez vos résultats vers le stockage objet S3
  • libérez les ressources une fois que vous avez terminé

Pour vous aider, l’interface Onyxia vous permet de faire cela en quelques clics.

2 Lancement des services

Les datalabs de l’INSEE et du GENES proposent les services nécessaires.

2.1 Se connecter

Connectez-vous à l’une des 2 instances suivantes d’Onyxia :

Tip

Il est fortement recommandé d’utiliser en priorité le SSP Cloud qui est plus stable.

2.2 PostgreSQL

    • Catalogue de services ➡️ Databases

Lorsque vous lancez le services, les paramètres de connexion à cette base de données sont affichés.

Une fois le service lancé, vous pouvez toujours accéder à ces paramètres via le bouton README.

    • Hostname
    • Port : 5432
    • Database : defaultdb
    • Username
    • Password

Elles serviront pour vous connecter à cette base de données depuis le service cloudBeaver

2.3 CloudBeaver

Nous venons de créer un SGBD, nous avons maintenant besoin d’un outil de gestion pour s’y connecter et envoyer des requêtes.

    • Collez username et password

Normalement la connexion à la base de données PostgreSQL est détectée automatiquement.

Si c’est le cas, elle apparait dans l’explorer à gauche qui contient la liste des connexions.

TipSi la connexion PostgreSQL n’apparait pas

Dans cloudBeaver :

    • cliquez sur le + en haut à gauche ➡️ New connection ➡️ PostgreSQL
    • Hostname, Port, Database, Username, Password

Il faut maintenant ouvrir la connexion :

Enfin, ouvrez une fenêtre SQL pour saisir vos requêtes :

Vous pouvez lancer quelques requêtes simples pour vérifier que tout fonctionne.

SELECT 1;

SELECT NOW();

SELECT current_database();

SELECT version();

3 Arrêt des services

Une fois le TP terminé, il est important de libérer les ressources réservées i.e. arrêter / mettre en pause vos services :

    • par exemple dans P:/Cours1A/UE3-Bases-de-donnees-relationnelles/tpx.sql
    • ou en téléchargeant depuis CloudBeaver le fichier sql (petit bouton avec un dossier et une flèche vers le bas)