Salaire: 70 000 € - 85 000 €
Devenez l'architecte de "l'usine de plateformes" au sein d'un cabinet de conseil d'élite.
Nous recrutons un profil capable de concevoir, rationaliser et opérer les infrastructures qui font tourner l'IA de nos clients de manière industrielle et performante.
Vos Missions (Ratio 70% Build / 30% R&D-Conseil) :
GenAIOps & Machinerie Système :
Gestion et optimisation de serveurs MCP (Model Context Protocol), mise en place de la télémétrie complète, de l'observabilité et du tracing des architectures LLM.
Data Streaming & Vectorisation :
Conception de pipelines de vectorisation des flux de données à la volée (streaming vers le RAG).
FinOps & Efficience à l'échelle :
Gestion fine de la tokenisation, du caching, choix du découpage sémantique (chunking) et arbitrages budgétaires complexes (évaluer le coût d'un RAG vs un Fine-Tuning de modèle).
Scaling & Conteneurisation :
Déploiement et optimisation de modèles ouverts via des outils de pointe comme vLLM.
Profil Senior Software/Cloud Engineer spécialisé dans l'infrastructure de production IA.
Approche Multi-Cloud et agnostique
Maîtrise avancée de Python et des frameworks d'orchestration agentiques
Maîtrise de technologies de scaling de modèles (vLLM) et sensibilité aux problématiques de performance à l'échelle.
La connaissance ou la maîtrise de Databricks constitue un excellent bonus