La Direction du numérique recrute : rejoignez-la !
Le ministère de la Justice s’est engagé dans une dynamique de transformation numérique ambitieuse au profit d’une justice plus lisible, plus accessible et plus efficace. L’ambition est de faire du ministère de la Justice un acteur majeur dans le développement de l’administration numérique.
La Direction du numérique définit ainsi, au regard des orientations interministérielles et en lien avec les directions et services, la stratégie de développement du numérique du ministère.
Vos missions
Rattaché(e) au département Infrastructures et des Services du Socle (ISS) et placé(e) sous la responsabilité du chef de bureau Ingénierie, Réseau, Infrastructure et Systèmes (IRIS), vous intervenez en tant qu'architecte infra cloud et GPU & inférence IA. Votre rôle sera d’apporter votre expertise dans l’utilisation de GPU et de service d’inférence d’inférence VLLM dans un contexte principalement Cloud (VM ou K8S Managé) et d’intégration de service LLMaaS. Vous devrez avoir une compréhension approfondie de l'architecture Cloud et GPU et être en capacité d’évaluer les performances de la pile matérielle et logicielle.
À ce titre, vos principales missions (liste non-exhaustive) seront de :
- Concevoir et déployer une infrastructure GPU scalable et performante pour l’inférence des LLMs, capable de supporter jusqu’à plusieurs dizaines de milliers d’utilisateurs en diret ou via des services API
- Mettre en place un dispositif permettant gérer un parc Modèle LLM instanciés et optimiser leur déploiement.
- Concevoir et articuler les gateway et API d’inférence et de RAG (BDD Vectorielle Elastic) à destination des Applicatif tiers.
- Mettre en place des mécanismes robustes de gestion des guardrails, quotas, rate limiting, gestion de file d’attente et sécurité avancée IAM
- Implémenter des solutions de monitoring et observabilité avancées (Prometheus, Grafana).
- Etablir les choix de système d’exploitation et des middlewares de associés à ce contexte.
- Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM
- Assurer un support interne de niveau 3 sur ces produits.
- Superviser le choix des frameworks, outils et technologies en collaboration avec les data scientists, ML engineers et devOps
- Garantir la scalabilité, la maintenabilité et la sécurité de l’infrastructure
- Évaluer l’impact technique et fonctionnel des choix architecturaux
- Mettre en place et développer des outils d'analyse et d'amélioration des performances
- Maitriser les couts d’usage et identifier et proposer des optimisations.
- Assurer l’optimisation continue (load balancing, auto-scaling) et la haute disponibilité des systèmes.
- Effectuer une veille technologique sur les meilleures pratiques de déploiement à grande échelle de modèles LLM (Triton, vLLM, Ray Serve)
Spécificités du poste / Contraintes / Sujétions
Poste soumis à une habilitation au Secret de la défense nationale OUI (1) ✔ NON
Poste nécessitant une enquête administrative de sécurité OUI (2) ✔ NON
(1) Le poste pouvant nécessiter d'accéder à des informations relevant du secret de la défense nationale, le titulaire retenu fera l'objet d'une procédure d’habilitation conformément aux dispositions de l’IGI 1300/SGDSN/PSE/PSD du 9 août 2021.
(2) Conformément à l’article R.114-2 du Code de la sécurité intérieure modifié par le décret n°2018-434 du 4 juin 2018, la décision administrative de recrutement peut nécessiter la réalisation d'une enquête administrative destinée à vérifier que le comportement de la personne intéressée n'est pas incompatible avec l'exercice des fonctions ou des missions envisagées.
Astreintes OUI NON ✔
Déplacements Réguliers Ponctuels Aucun
Votre profil
Intéressé(e) par le monde judiciaire et par le fonctionnement de la justice en France, vous êtes diplômé(e) d'une école d'ingénieur ou équivalent universitaire. Vous justifiez également d'au moins 5 ans d’expérience dans un poste similaire.
Compétences requises
- Expérience dans le déploiement à grande échelle de systèmes distribués (multi-GPU, multi-modèles).
- Environnements matériels : processeurs, GPU, serveurs multiprocesseurs, interfaces de communication ;
- Compétences solides en sécurité et architecture Cloud (IAAS, CAAS)
- Système d'exploitation Linux : administration système, scripts d'automatisation (Bash, python, etc.), DHCP, Diskless, PXE ;
- Environnements de mesure et de gestion du rendement : logiciels de mesure de performances, outils de développement et de débogage système ;
- Connaissance du noyau et des sous-systèmes majeurs ;
- Maîtrise avancée des architecture microservices et conteneurisation (OpenShift, Kubernetes)
- Connaissance des pratiques CI/CD et Infrastructure as Code (Terraform, Kubernetes, GitLab, ArgoCD).
- Connaissance des bases de données vectorielles (Elactic, )
- Connaissance des langages Python, Java, Scala
- Connaissance en machine learning, deep learning
- Connaissance en gestion de modèles IA (MLOps, MLFlow, Hugingface…)
- Connaissance en data engineering (Spark, Kafka, Airflow)
- Connaissance en sécurité des systèmes IA (authentification, protection des modèles, RGPD)
- Connaissances des process de Production et d’exploitation process ITIL
Qualités attendues
- Esprit ouvert & Capacité d’initiative
- Vous faites preuve d’un leadership technique reconnu
- Capacités relationnelles (conduite de réunion, négociation)
- Capacités rédactionnelles (rapports, synthèses, …) et maîtrise de l’anglais professionnel
- Intéressé(e) par le monde judiciaire et plus généralement par l’administration publique
Avantages
-
Restauration d’entreprise à tarif dégressif
-
Télétravail jusqu’à 3 jours par semaine
-
Mutuelle obligatoire (Intériale)
-
Accessibilité en transport (RER E Rosa Parks, T3b, M12 Front populaire, M7 Corentin Cariou puis navette fluviale)
-
Parking privatif (vélo, voiture, scooter…)
-
Remboursement des frais des transports en communs à hauteur de 75% (selon plafonds fixé)
-
Association sportive et culturelle
-
Partenariat avec une crèche d’entreprise en Ile-de-France
-
Des opportunités d’évolutions (mobilité interne, ascendante)
-
Des opportunités de formation allant jusqu’à 3 formations par an