Administrateur(trice) Système HPC F/H
CDI | Confirmé | Centre de calcul – Environnement scientifique
Démarrage : À définir
Contexte du poste
Alliance Services Plus (AS+) recherche un(e) Administrateur(trice) Systèmes Linux HPC pour le compte d’un client opérant des infrastructures de calcul intensif à grande échelle, au service d’activités scientifiques et techniques exigeantes.
Intégré(e) au sein des équipes d’exploitation, vous contribuerez au maintien en condition opérationnelle d’une plateforme HPC critique, utilisée par une communauté importante d’utilisateurs pour des travaux de simulation, de modélisation et de calcul scientifique à grande échelle.
Missions principales
Dans un cadre d’exploitation et d’évolution des infrastructures HPC, les missions pourront inclure :
L’administration, le maintien en condition opérationnelle et l’optimisation d’environnements Linux à grande échelle
La gestion et l’exploitation d’infrastructures de calcul intensif (clusters HPC)
Le support technique de niveau 2/3 auprès des utilisateurs scientifiques
L’administration des ordonnanceurs de jobs et des systèmes de fichiers parallèles
Le déploiement, la mise à jour et l’optimisation des environnements logiciels scientifiques
L’automatisation des tâches d’administration et d’exploitation
La gestion des incidents, le diagnostic et la résolution de problèmes complexes
La participation aux opérations de maintenance et aux évolutions d’architecture
La rédaction et la mise à jour de la documentation technique et des procédures
La participation à la veille technologique et à l’amélioration continue des plateformes
Environnement technique
Les projets s’appuient principalement sur les technologies suivantes :
Systèmes d’exploitation : Linux (RHEL, CentOS, Rocky Linux, Ubuntu)
Clusters HPC : infrastructures de calcul intensif multi-nœuds
Ordonnanceurs : Slurm (principal), PBS Pro (selon environnements)
Stockage : systèmes de fichiers distribués (Lustre, GPFS)
Réseaux haute performance : InfiniBand
Automatisation & scripting : Bash, Python, Ansible
Gestion d’environnements logiciels : modules (Lmod / module-tcl), Spack
Supervision & exploitation : outils de monitoring HPC et systèmes
Architectures matérielles : CPU x86_64 / ARM, GPU (NVIDIA – selon périmètre)
Profil recherché
Formation Bac+5 (École d’ingénieur, Master) ou expérience équivalente
Expérience confirmée en administration systèmes Linux dans un environnement complexe
Connaissance des environnements HPC et des contraintes associées (performance, scalabilité, disponibilité)
Maîtrise des outils d’exploitation Linux et des mécanismes d’automatisation
Capacité à intervenir sur des infrastructures critiques en production
Qualités attendues :
Rigueur et sens de l’analyse
Autonomie et capacité à prioriser
Bon relationnel et aptitude à travailler avec des utilisateurs experts
Capacité à documenter et à formaliser les procédures
Esprit d’équipe et sens du service
- Département
- HPC
- Poste
- Administrateur Système HPC
- Localisations
- Montpellier
À propos de GECI Int.
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l’Industrie et des Services.