Notre client est un acteur industriel de premier plan engagé dans l’industrialisation de cas d’usage d’IA générative afin d’accélérer l’automatisation de processus, fiabiliser l’accès à la connaissance et améliorer la productivité des équipes opérationnelles. Dans un contexte de mise à l’échelle (assistants conversationnels, chatbots et agents) et d’exigences élevées en matière de sécurité, réseau et conformité, l’enjeu est de sécuriser une mise en production robuste sur Azure. Pour soutenir cette trajectoire, notre client souhaite renforcer son dispositif avec un profil senior capable de délivrer des solutions GenAI de bout en bout, avec une forte maîtrise du cloud Azure et du backend Python.
La mission s’inscrit dans un programme d’industrialisation et de déploiement d’assistants conversationnels et d’agents IA destinés à soutenir des processus métiers (support interne, recherche documentaire, aide à la décision, automatisation de tâches). L’objectif est de passer du prototypage à des produits IA exploitables à l’échelle : sécurisés, observables, maintenables et conformes aux standards d’entreprise.
Le consultant interviendra au cœur du delivery, avec une responsabilité forte sur l’architecture Azure et la mise en production (MLOps/LLMOps) des solutions GenAI : choix des patterns d’architecture, intégration réseau/sécurité (VNet, endpoints privés), déploiement IaC, CI/CD, gouvernance et garde-fous (données sensibles, contrôle d’accès, traçabilité). Le rôle requiert également une posture "use-case oriented" : capacité à travailler au plus près des métiers pour cadrer, prioriser et transformer des irritants opérationnels en solutions IA mesurables (valeur, adoption, performance).
- Concevoir et développer des assistants conversationnels et agents IA orientés production : APIs backend Python (FastAPI/équivalent), orchestration LLM (LangChain/équivalent), patterns RAG et agentification, gestion du contexte et des outils (tools).
- Porter l’architecture cloud Azure de bout en bout pour des workloads GenAI : design sécurisé et industrialisable (Azure Web Apps/Container Apps, intégration réseau, VNet, Private Endpoints, DNS privé), gestion des identités et accès (RBAC, Managed Identities), et conformité aux standards d’entreprise.
- Mettre en œuvre la mise en production GenAI (LLMOps) : packaging, versioning, stratégie de déploiement, gestion de la configuration, promotion inter-environnements (dev/recette/prod), et stratégie de rollback.
- Intégrer les services Azure IA et recherche : Azure AI Foundry (ou services IA Azure), Azure AI Search (recherche vectorielle/hybride), conception des index, tuning du retrieval et du ranking, et optimisation de la latence/coûts.
- Construire la chaîne RAG de bout en bout : ingestion documentaire, extraction (Doc AI/équivalent), chunking, embeddings, stratégie de retrieval, évaluation de pertinence, et gestion des mises à jour (refresh, re-indexation).
- Définir et implémenter l’Infrastructure as Code (Terraform) : modules réutilisables, gestion du state, variables/secrets, standardisation des patterns, et automatisation des déploiements multi-environnements.
- Mettre en place et maintenir les pipelines CI/CD (Azure DevOps, GitHub Actions ou équivalent) : build, tests, scans sécurité, déploiements, contrôles qualité, gestion des versions et artefacts, dans une logique DevSecOps.
- Développer l’interface web lorsque nécessaire (React/JavaScript) : intégration des parcours conversationnels, gestion des sessions, consommation d’APIs, et UX de base des assistants.
- Assurer la qualité logicielle et la fiabilité en production : tests unitaires/intégration, gestion des erreurs, performance, résilience, gestion des coûts (FinOps), observabilité (logs, traces, métriques), et suivi spécifique GenAI (prompt/versioning, latence, taux d’erreur, qualité des réponses).
- Mettre en place des garde-fous IA et recommandations de gouvernance : sécurité des prompts (prompt injection, data leakage), contrôle d’accès, gestion des données sensibles, traçabilité/auditabilité, catalogue de prompts, critères d’évaluation et validation avant mise en production.
- Cadrer les cas d’usage avec les métiers : ateliers de recueil, formalisation en user stories/parcours, critères d’acceptation, définition MVP puis itérations, et mesure de valeur (gains de temps, qualité, réduction des irritants).
- Documenter et transférer : dossiers d’architecture, runbooks, guides d’exploitation, revues de code, ateliers et montée en compétence des équipes internes.
- Date de démarrage : ASAP
- Durée : 1 an renouvelable
- Localisation : La Défense
- Télétravail : 3 jours de télétravail par semaine
- TJM : selon profil
- Azure (niveau junior) : architecture sécurisée, réseau (VNet, Private Endpoints), intégration aux services IA, patterns d’industrialisation et exploitation
- Backend Python (niveau junior) : APIs (FastAPI/équivalent), structuration applicative, tests, packaging, bonnes pratiques de développement
- IA générative : LLM, RAG, agentification, prompt engineering, stratégies d’évaluation (qualité, factualité, robustesse)
- LangChain (ou framework équivalent) : orchestration de chaînes RAG et d’agents, outils, mémoire/contexte
- Azure AI Search : recherche vectorielle/hybride, indexation, tuning retrieval/ranking
- Infrastructure as Code : Terraform (modules, state, environnements, standardisation des déploiements)
- CI/CD : Azure DevOps, GitHub Actions (ou équivalent) + pratiques DevSecOps (scans, contrôles, promotion inter-environnements)
- Observabilité/monitoring : logs, traces, métriques, diagnostics applicatifs, suivi spécifique GenAI (prompts, latence, coûts)
- Front-end : React / JavaScript (capacité à intégrer une UI d’assistant et à consommer des APIs)
- SQL et fondamentaux data : modélisation, requêtes, intégration applicative
- Outils documentaires / routage LLM : LiteLLM, Mistral Doc AI (ou équivalents) appréciés
- Approche orientée cas d’usage : capacité à comprendre un problème opérationnel et à le transformer en solution IA industrialisée
- Cadrage produit : priorisation, itérations, définition de MVP, stratégie de passage à l’échelle
- Connaissance des enjeux d’industrialisation en environnement entreprise : sécurité, conformité, gestion des accès, traçabilité
- Capacité à formaliser des besoins métiers en user stories, parcours conversationnels et critères d’acceptation
- Communication et coordination avec des parties prenantes multiples (métiers, IT, sécurité, data, architecture)
- A déjà été impliqué sur le delivery end-to-end (du cadrage à la mise en production)
- Rigueur d’ingénierie : qualité, tests, documentation, maintenabilité
- Pragmatisme : arbitrage MVP vs industrialisation, focus valeur et adoption
- Capacité à challenger les choix techniques (architecture, sécurité, performance, coûts)
- Esprit collaboratif : ateliers métiers, revues de code, partage de bonnes pratiques