Ingénieur(e) HPC Senior
Contexte de la mission
Alliance Services Plus (AS+) recherche un(e) Consultant(e) HPC Senior pour intervenir dans le cadre d’un projet stratégique de conception et de déploiement d’une solution HPC accélérée GPU, au sein d’un environnement industriel à forts enjeux technologiques.
Le/la consultant(e) interviendra sur les phases de design, implémentation, migration applicative et benchmarking, en lien étroit avec les équipes d’architecture infrastructure, les équipes de développement applicatif du client et les partenaires technologiques.
Missions principales
Le/la consultant(e) interviendra sur plusieurs volets techniques complémentaires :
A) Architecture et implémentation HPC
Conception et mise en œuvre d’architectures HPC GPU scalables (calcul et réseau)
Design et déploiement de clusters GPU à grande échelle
Installation et configuration des nœuds de gestion, de visualisation, d’accès interactif et de calcul
Réalisation des tests d’acceptation des solutions
B) Réseaux et technologies NVIDIA
Déploiement et support des technologies réseau NVIDIA :
InfiniBand
Spectrum-X
MLNX-OS, Cumulus, SONIC
Administration et orchestration via des outils tels que NVIDIA Base Command Manager (ou équivalent)
C) Migration applicative et performance
Accompagnement à la migration des applications HPC vers la nouvelle infrastructure
Optimisation des performances applicatives afin d’exploiter pleinement les capacités GPU
Mise en œuvre, exécution et analyse de benchmarks de performance
Ajustements et optimisations en fonction des résultats obtenus
D) Interface technique et accompagnement
Rôle d’interface technique entre les équipes d’architecture, les équipes de développement applicatif du client et les partenaires technologiques (dont NVIDIA)
Production de documentation technique : architectures, guides de déploiement, procédures opérationnelles
Support opérationnel, troubleshooting et montée en compétence des équipes clientes
Environnement technique
Environnements HPC accélérés GPU NVIDIA
Clusters GPU à grande échelle
Réseaux haute performance (InfiniBand et technologies NVIDIA)
Outils d’orchestration et de gestion HPC
Interaction étroite avec équipes infrastructure et développement applicatif
Profil recherché
Compétences essentielles
Expertise confirmée en High Performance Computing (HPC)
Solide expérience dans la conception et le déploiement de clusters GPU NVIDIA
Maîtrise des technologies réseau NVIDIA et des architectures à grande échelle
Administration Linux et compétences en scripting
Expérience avec Base Command Manager ou outils similaires
Excellentes capacités de communication, de conseil et de rédaction technique
Capacité à piloter plusieurs sujets techniques en autonomie et à interfacer avec des équipes de développement
Compétences appréciées
Certifications techniques : CCNP, LFCS, NCP-AIN, NCP-AIO
Expérience avec NVIDIA DGX, Kubernetes, Docker, Slurm
Connaissance des environnements datacenter, de l’intégration cloud ou des frameworks GenAI
- Département
- HPC
À propos de GECI Int.
GECI International est un spécialiste de la Technologie et du Digital. Depuis son origine en 1980, le Groupe innove pour concevoir et développer des solutions, produits et services intelligents pour les secteurs de la Recherche, de l’Industrie et des Services.