Contexte de la mission

Alliance Services Plus (AS+) recherche un(e) Consultant(e) HPC Senior pour intervenir dans le cadre d’un projet stratégique de conception et de déploiement d’une solution HPC accélérée GPU, au sein d’un environnement industriel à forts enjeux technologiques.

Le/la consultant(e) interviendra sur les phases de design, implémentation, migration applicative et benchmarking, en lien étroit avec les équipes d’architecture infrastructure, les équipes de développement applicatif du client et les partenaires technologiques.

Missions principales

Le/la consultant(e) interviendra sur plusieurs volets techniques complémentaires :

A) Architecture et implémentation HPC

Conception et mise en œuvre d’architectures HPC GPU scalables (calcul et réseau)
Design et déploiement de clusters GPU à grande échelle
Installation et configuration des nœuds de gestion, de visualisation, d’accès interactif et de calcul
Réalisation des tests d’acceptation des solutions

B) Réseaux et technologies NVIDIA

Déploiement et support des technologies réseau NVIDIA :
- InfiniBand
- Spectrum-X
- MLNX-OS, Cumulus, SONIC
Administration et orchestration via des outils tels que NVIDIA Base Command Manager (ou équivalent)

C) Migration applicative et performance

Accompagnement à la migration des applications HPC vers la nouvelle infrastructure
Optimisation des performances applicatives afin d’exploiter pleinement les capacités GPU
Mise en œuvre, exécution et analyse de benchmarks de performance
Ajustements et optimisations en fonction des résultats obtenus

D) Interface technique et accompagnement

Rôle d’interface technique entre les équipes d’architecture, les équipes de développement applicatif du client et les partenaires technologiques (dont NVIDIA)
Production de documentation technique : architectures, guides de déploiement, procédures opérationnelles
Support opérationnel, troubleshooting et montée en compétence des équipes clientes

Environnement technique

Environnements HPC accélérés GPU NVIDIA
Clusters GPU à grande échelle
Réseaux haute performance (InfiniBand et technologies NVIDIA)
Outils d’orchestration et de gestion HPC
Interaction étroite avec équipes infrastructure et développement applicatif

Profil recherché

Compétences essentielles

Expertise confirmée en High Performance Computing (HPC)
Solide expérience dans la conception et le déploiement de clusters GPU NVIDIA
Maîtrise des technologies réseau NVIDIA et des architectures à grande échelle
Administration Linux et compétences en scripting
Expérience avec Base Command Manager ou outils similaires
Excellentes capacités de communication, de conseil et de rédaction technique
Capacité à piloter plusieurs sujets techniques en autonomie et à interfacer avec des équipes de développement

Compétences appréciées

Certifications techniques : CCNP, LFCS, NCP-AIN, NCP-AIO
Expérience avec NVIDIA DGX, Kubernetes, Docker, Slurm
Connaissance des environnements datacenter, de l’intégration cloud ou des frameworks GenAI

Ingénieur(e) HPC Senior

À propos de GECI Int.

Ingénieur(e) HPC Senior