Dans le cadre d’un programme stratégique d’industrialisation de l’IA Générative à l’échelle Groupe, nous recherchons un Senior DevOps / Platform Engineer capable de concevoir, sécuriser et scaler les infrastructures supportant les plateformes Mistral AI et Prisme AI dans un environnement bancaire critique et fortement réglementé.
Le programme IA Gen vise à construire une plateforme souveraine d’IA générative et agentique capable de supporter des cas d’usage massifs, avec de fortes contraintes :
Vous rejoindrez une équipe transverse composée d’AI Engineers, Platform Engineers, Security Engineers, Architects, MLOps et équipes Infrastructure.
Déploiement enterprise-scale de plateformes LLM
Orchestration de workloads IA intensifs CPU/GPU
Industrialisation de pipelines MLOps / LLMOps
Scalabilité Kubernetes multi-environnements
Observabilité temps réel des systèmes IA
Sécurisation des infrastructures GenAI
Déploiement hybride AWS + On-Prem
Automatisation complète des déploiements IA
Optimisation inference serving & consommation GPU
Concevoir et maintenir des infrastructures cloud et on-prem hautement disponibles pour les plateformes IA générative
Déployer et administrer des clusters Kubernetes dédiés aux workloads IA et LLM
Optimiser l’allocation des ressources :
CPU
GPU
mémoire
stockage
networking
Gérer la scalabilité horizontale et verticale des plateformes IA
Participer à l’architecture des plateformes de serving LLM et inference APIs
Construire et industrialiser des pipelines CI/CD pour :
modèles IA
APIs IA
applications agentiques
composants MLOps
Automatiser les déploiements et rollback sécurisés
Mettre en place des stratégies GitOps et Infrastructure as Code
Garantir :
AWS
Hybrid Cloud
On-Prem Infrastructure
Docker
Kubernetes
Helm
Kustomize
GitLab CI
GitHub Actions
ArgoCD
Terraform
Ansible
Prometheus
Grafana
ELK
Loki
OpenTelemetry
5+ années d’expérience en DevOps / Platform Engineering / SRE
Très forte expertise Kubernetes en production
Expérience solide AWS + environnements hybrides
Maîtrise des pipelines CI/CD et Infrastructure as Code
Expérience sur des plateformes critiques à forte volumétrie
Bonne compréhension des problématiques MLOps / LLMOps
Expérience workloads GPU ou IA fortement appréciée
Background banque / finance / environnement réglementé apprécié
Expérience plateformes IA Générative
Déploiement de modèles LLM self-hosted
GPU scheduling / NVIDIA stack
Kubernetes GPU operators
Serving haute performance
Infrastructure IA souveraine
SRE / Reliability Engineering
Sécurisation plateformes IA enterprise