INGÉNIEUR SYSTÈME HPC / SYSOPS
INGÉNIEUR SYSTÈME HPC / SYSOPS
Infogérance High-Performance Computing
Secteur Nucléaire – Infrastructure Critique Nationale
Autorité publique indépendante – Secteur nucléaire
Sûreté nucléaire et radioprotection – Infrastructure critique
Région parisienne – Île-de-France
Début mai 2026
24 mois (reconductible 2 × 12 mois)
CDI (habilitation de sécurité requise)
Contexte de la Mission
Alliance Services Plus (AS+) recherche un(e) Ingénieur(e) Système HPC hautement qualifié(e) pour assurer l'infogérance de l'infrastructure de calcul haute performance d'une autorité publique indépendante française du secteur nucléaire, dans le cadre d'un marché public stratégique.
Notre client est chargé de missions critiques en matière de sûreté nucléaire et de radioprotection, incluant la recherche, l'expertise technique, la réglementation et le contrôle des activités nucléaires civiles en France.
Cette mission s'inscrit dans un environnement hautement régulé et critique pour la sûreté nationale, nécessitant expertise technique approfondie, rigueur absolue, et habilitation de sécurité.
⚠️ Exigences Critiques
• Habilitation de sécurité obligatoire
• Nationalité française ou UE requise
• Disponibilité 24/7 pour infrastructure critique
• Conformité stricte aux normes de sécurité et réglementations nucléaires
Missions Principales
Phase de Prise en Charge
• Audit complet de l'infrastructure HPC existante (architecture, performances, sécurité, conformité)
• Documentation exhaustive conforme aux standards nucléaires et traçabilité réglementaire
• Mise en place des processus d'infogérance haute disponibilité et outils de supervision
• Transition sécurisée et transfert de compétences avec équipes sortantes
Phase de Production – Administration Système
• Administration des clusters HPC dédiés aux calculs de sûreté nucléaire et radioprotection
• Gestion des ordonnanceurs de jobs en environnement haute criticité (Slurm, PBS Pro)
• Supervision et monitoring 24/7 avec alerting temps réel (Nagios, Prometheus, Grafana)
• Gestion des incidents critiques et résolution rapide (ITIL, procédures d'urgence)
• Maintenance préventive et corrective avec fenêtres d'intervention planifiées
• Gestion sécurisée des mises à jour système (validation, tests, rollback procedures)
• Optimisation performances pour codes de calcul scientifiques (modélisation, simulations sûreté)
• Traçabilité complète et reporting conformité réglementaire
Phase de Production – Expertise Technique
• Support aux chercheurs et experts pour applications scientifiques HPC (codes de simulation, modélisation)
• Installation et optimisation de codes de calcul complexes en sûreté nucléaire
• Expertise parallélisation (MPI, OpenMP) et optimisation GPU pour simulations intensives
• Conteneurisation sécurisée d'applications scientifiques (Singularity)
• Veille technologique HPC et recommandations d'évolution conformes aux enjeux de sûreté
Activités Complémentaires – Projets Stratégiques
• Participation aux projets de modernisation et extension des infrastructures HPC
• Intégration de nouvelles architectures (CPU, GPU, accélérateurs) pour amélioration capacités calcul
• Migration et transformation infrastructure en maintenant continuité de service
• Support aux opérations d'intégration de codes de calcul très complexes
Profil Recherché
Compétences Techniques Requises
• Expertise Linux (RHEL, CentOS, Rocky Linux, Ubuntu Server) en environnement HPC de production
• Maîtrise ordonnanceurs : Slurm (obligatoire), PBS Pro, Torque
• Administration clusters HPC : architecture, stockage parallèle, réseau haute performance
• Systèmes de fichiers parallèles : Lustre (prioritaire), GPFS/Spectrum Scale, BeeGFS
• Réseau haute performance : InfiniBand, RoCE (configuration, optimisation, troubleshooting)
• Scripting avancé : Bash, Python (automatisation, orchestration)
• Monitoring et supervision : Nagios, Prometheus, Grafana, collectd, Zabbix
• Gestion de configuration : Ansible (obligatoire), Puppet, Chef, Salt
• Sécurité système : hardening, audit, conformité réglementaire, gestion incidents de sécurité
Compétences Techniques Souhaitées
• Expérience GPU computing : NVIDIA CUDA, AMD ROCm (portage, optimisation codes calcul)
• Bibliothèques scientifiques HPC : OpenMPI, MPICH, Intel MKL, BLAS/LAPACK
• Conteneurisation HPC : Singularity/Apptainer (prioritaire), Docker
• Environnements modules : Lmod, environment-modules
• Debugging et profiling : gdb, valgrind, profilers HPC (Intel VTune, ARM MAP)
• Codes de calcul scientifiques (CFD, simulation physique, modélisation)
• Virtualisation et cloud HPC : OpenStack, Kubernetes (K8s pour HPC)
Formation et Expérience
• Diplôme : Bac+5 (Master/Ingénieur) en informatique, calcul scientifique, ou équivalent
• Expérience : Minimum 5-7 ans en administration système HPC ou infrastructures critiques
• Expérience en environnement hautement régulé (nucléaire, défense, santé, recherche publique) fortement appréciée
Qualités Professionnelles
• Rigueur absolue et sens aigu des responsabilités en environnement critique
• Capacité à gérer le stress et à prendre des décisions rapides en situation d'urgence
• Respect strict des procédures, normes de sécurité et confidentialité
• Excellent relationnel et pédagogie pour support utilisateurs experts
• Autonomie, proactivité et force de proposition
• Esprit d'équipe et capacité à collaborer en environnement multidisciplinaire
• Excellente communication écrite et orale (documentation, reporting)
• Maîtrise du français (obligatoire) – Anglais technique pour documentation internationale
Ce que Nous Offrons
• Mission stratégique au cœur de la sûreté nucléaire française (2 à 4 ans)
• Environnement technique exceptionnel : infrastructures HPC de pointe dédiées à la recherche en sûreté nucléaire
• Intégration au sein d'Alliance Services Plus, opérateur des 3 centres nationaux Tier-1 (TGCC, IDRIS, CINES)
• Accès à l'expertise HPC nationale et accompagnement par nos équipes techniques seniors
• Formation continue et développement professionnel (technologies HPC, sécurité, conformité)
• Participation à des projets de transformation majeurs dans un secteur stratégique
• CDI stable avec rémunération attractive selon profil et expérience
• Contribution directe à la sûreté nucléaire et à la protection radiologique en France
À propos de GECI Int.
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l’Industrie et des Services.