Le ou la Data Ingénieur·e IA conçoit, met en place et opère les pipelines de données qui alimentent les cas d?usage d?intelligence artificielle (machine learning, LLM, analytics avancée). Le poste vise à garantir la disponibilité, la qualité, la traçabilité et la performance des données de bout en bout, depuis les sources (SI, APIs, fichiers, logs) jusqu?aux environnements d?entraînement et de production. En lien étroit avec les équipes Data Science, Produit, DevOps et Sécurité, la personne contribue à industrialiser les flux et à fiabiliser l?écosystème data.
Livrables
Pipelines de données documentés et automatisés, avec contrôles de qualité (validation, déduplication, gestion des valeurs manquantes) et mécanismes de reprise sur incident. Jeux de données prêts pour l?IA (datasets d?entraînement/validation, tables de features, embeddings si nécessaire) et interfaces d?accès stables pour les équipes consommatrices. Tableaux de bord de supervision (fraîcheur, volumes, erreurs, coûts), documentation opérationnelle (runbooks) et contribution aux standards (naming, conventions, modèles) de la plateforme.
Profil candidat:
Compétences
Solides bases en modélisation et architecture data (schémas, normalisation, data lake/warehouse, formats colonnes), ainsi qu?en intégration (ETL/ELT, streaming, orchestration). Maîtrise de SQL et d?un langage de programmation (Python le plus souvent), bonnes pratiques de développement (tests, CI/CD, revue de code) et compréhension des contraintes MLOps (feature store, versioning, reproductibilité, monitoring). Connaissance des environnements cloud et conteneurisation (IAM, stockage, réseau, Docker, Kubernetes) et sensibilité aux sujets de sécurité, conformité et gouvernance (RGPD, gestion des accès, catalogage, qualité).