Mise en production de la nouvelle infrastructure R/RStudio

Ajouté par Mehdi Belkacem il y a presque 2 ans

Bonjour,

Le CTIG lance aujourd’hui une nouvelle offre R/RStudio sur ses infrastructures. Vous pouvez dès maintenant accéder à RStudio (version « server ») via le WEB avec l'URL :

https://ctig-services.inrae.fr/Rstudio

Ce service, implanté sur un serveur dédié, est accessible depuis les réseaux INRAE ainsi que les réseaux des partenaires du département GA. Tous les utilisateurs ayant aujourd’hui accès à l’environnement de calcul du CTIG (dga20, dga-cluster, le cluster SGE) pourront s’y connecter en utilisant les mêmes identifiants/mots de passe. Ils y retrouveront leur environnement "données" habituel (espaces « home », espaces équipe ou projet, espace de travail).

Sur ce serveur vous pouvez développer et exécuter des programmes avec 4 environnements, chacun avec sa version de R. A la date de démarrage il s’agit des versions 3.5.1, 3.6.2, 4.0.1 et 4.1.1.

Règles de fonctionnement

Les règles de fonctionnement de ce service ont été définies lors de la mise en place d’une maquette avec l’appui d’un groupe d’utilisateurs volontaires (Hervé Chapuis, Iola Croue, Arnaud Delpeuch, Chris Hoze, Tom Rohmer). Elles vont évoluer avec la montée en charge du service.

Les versions de Rstudio

  • 4 versions de R sont disponibles à une date donnée (3 versions de « prod » plus une en test)
  • Une nouvelle version (si elle existe et a un numéro x.1) est mise en place tous les 6 mois, cela s’accompagne de suppression de la plus ancienne

La gestion des packages

  • Les packages sont disponibles dans une copie locale du CRAN. Cette copie est créée avec les packages disponibles le 30 du mois suivant la date de sortie de la version correspondante de R. Cette copie ne sera pas modifiée (pas d'ajout ou de mise à jour de packages) durant toute la vie de la version de R
  • Les packages les plus utilisés sont déjà installés par défaut
  • L’utilisateur peut installer des packages, mais uniquement pour lui même

Les packages les plus installés par les utilisateurs dans les versions précédentes sont installés par défaut dans le version n+1.

Dimensionnement

Pour la mise en place de l’environnement RStudio Server est installé sur un serveur avec 256 Go de RAM (dont seulement 128 Go disponibles pour un utilisateur).

2 nœuds du cluster avec 128Go de mémoire ainsi qu’un nœud virtuel de 512 Go de mémoire sont accessibles pour lancer les programmes avec les mêmes versions de R. Les nœuds du cluster sont accessibles via SGE en utilisant la classe redhat8q

Ce dimensionnement évoluera en fonction la montée en charge du service.

Documentation, support, évolutions

Les documentations et mode d’emploi sont accessibles sur la forge dga via le lien ci-dessous :

https://forge-dga.jouy.inra.fr/projects/ctig-env-base/wiki/Infrastructure_Rstudio

En cas de problème, vous pouvez demander de l’assistance via le projet « R sur les serveurs CTIG » sur la forge du CTIG: https://ctig-forge.jouy.inra.fr/projects/r-sur-les-serveurs-ctig. De manière exceptionnelle, vous pouvez contacter l’équipe système via l’adresse . Dans tous les cas, il sera utile de vous munir de votre adresse IP (*).

Nous vous encourageons à échanger largement avec la communauté des utilisateurs RStudio via le forum hébergé sur le forge dga : https://forge-dga.jouy.inra.fr/projects/ctig-env-base/boards/24

IMPORTANT :

R et RStudio restent disponibles sur dga20 et le cluster de calcul mais il n’y aura plus de montée de niveau des versions R et R studio, ni d'installation de nouveau package.


Commentaires