Dans le cadre d’un programme IA Générative stratégique à l’échelle groupe, nous recherchons un Senior AI Engineer capable d’industrialiser des solutions GenAI souveraines basées sur la plateforme Mistral AI dans un environnement bancaire critique, sécurisé et fortement réglementé.
Le contexte est particulièrement stimulant techniquement : déploiement massif de LLMs, architectures agentiques avancées, optimisation d’inférence, sécurisation des usages IA, orchestration multi-agents et industrialisation MLOps à grande échelle.
Vous rejoindrez une équipe transverse IA Gen composée d’AI Engineers, Platform Engineers, MLOps, Data Engineers, Security Engineers et Product teams afin de construire les futurs standards IA du Groupe.
Déploiement enterprise-scale de modèles Mistral
Construction de plateformes GenAI souveraines et sécurisées
Développement d’agents IA autonomes et multi-agents
Industrialisation de pipelines LLMOps / MLOps
Optimisation performance / latence / coût GPU
Gouvernance IA, sécurité et conformité AI Act
Détection d’hallucinations et contrôle qualité des outputs
Observabilité et monitoring des systèmes IA en production
Intégration des solutions IA dans le SI bancaire critique
Concevoir et développer des applications IA générative robustes exploitant Mistral et autres LLM open-source/propriétaires
Construire des architectures RAG avancées adaptées à des usages enterprise-scale
Implémenter des pipelines de prompting complexes :
few-shot
chain-of-thought
structured prompting
tool calling
function calling
context management
Optimiser les performances d’inférence, la qualité des réponses et la consommation des ressources
Évaluer les modèles selon des métriques :
hallucination rate
factuality
latency
token efficiency
cost efficiency
Concevoir des agents IA autonomes capables de :
reasoning
planning
memory management
tool orchestration
workflow execution
Développer des architectures multi-agents distribuées
Implémenter des mécanismes de coordination, supervision et fallback agents
Gérer les contextes conversationnels complexes et les interactions user-agent
Travailler avec :
Industrialiser les déploiements IA dans des environnements Kubernetes sécurisés
Construire des pipelines CI/CD dédiés aux modèles et applications IA
Mettre en place :
model versioning
prompt versioning
evaluation pipelines
observability
tracing
monitoring LLM
Participer à l’optimisation GPU / inference serving
Collaborer étroitement avec les équipes DevOps et Platform Engineering
Python
FastAPI
Pydantic
AsyncIO
Mistral AI
OpenAI
Claude
Llama
Hugging Face
vLLM
Ollama
Transformers
LangChain
LangGraph
CrewAI
AutoGen
Semantic Kernel
Vector DB
Embeddings
Hybrid Search
Reranking
Knowledge Retrieval
Docker
Kubernetes
Helm
CI/CD
MLflow
GitLab CI
Observability stacks
5+ années d’expérience en Software Engineering / AI Engineering
Expérience solide en GenAI et architectures LLM en production
Forte expertise Python et engineering backend
Expérience concrète sur des systèmes agentiques
Très bonne compréhension des problématiques d’industrialisation IA
Expérience en environnement critique ou réglementé fortement appréciée
Capacité à intervenir sur des sujets architecture, performance et sécurité
Expérience Mistral AI
Déploiement self-hosted de LLMs
Optimisation inference serving
Fine-tuning / PEFT / LoRA
Expérience GPU workloads
Expérience plateforme IA enterprise
Banking / Finance / Cybersecurity background