Date de démarrage : ASAP
Date de fin : 31/10/2026
Localisation : Paris
Tarif Journalier Moyen (TJM) Max : 660 ?
Descriptif de la MissionAu sein des équipes Data, vous interviendrez sur la conception, le développement, la gouvernance et l'optimisation de nos plateformes de données. Vos activités principales s'articuleront autour de quatre grands piliers :
1. Développement & Architecture DataConcevoir et développer des pipelines de données robustes et scalables sur Databricks (PySpark, Spark SQL, Delta Live Tables).
Mettre en place des architectures Lakehouse basées sur Delta Lake.
Industrialiser et orchestrer les workflows ETL/ELT à l'aide de Databricks Workflows.
2. Gestion et Administration de la Plateforme DatabricksAdministrer l?espace de travail (gestion des workspaces, configuration des clusters, gestion des permissions).
Assurer l'optimisation des coûts (finops) via la configuration fine, l?autoscaling et le monitoring des clusters.
Implémenter et faire respecter les bonnes pratiques de sécurité (Unity Catalog, gestion des accès, lineage de la donnée).
3. Gouvernance & Qualité des DonnéesMettre en place des mécanismes stricts de qualité et de validation des données (expectations, tests automatisés).
Documenter rigoureusement les modèles et les flux sur la plateforme.
Garantir la fiabilité, la cohérence et la fraîcheur des données mises à disposition.
4. Collaboration & SupportCollaborer étroitement avec les Data Analysts, Data Scientists et les équipes métiers.
Accompagner et former les utilisateurs clés dans l?adoption et la prise en main de l'écosystème Databricks.
Participer activement aux revues de code, à la standardisation et au partage des bonnes pratiques d'ingénierie.
Compétences RequisesTechniques (Incontournables) : Développement : Excellente maîtrise de PySpark ou Spark SQL.
Écosystème : Forte expérience pratique avec Databricks (pipelines, clusters, notebooks, Unity Catalog).
Architecture : Solides connaissances des architectures Lakehouse, du data modeling, des concepts ETL/ELT et des stratégies d'ingestion (batch & streaming).
Cloud : Connaissance approfondie d?au moins un des principaux fournisseurs cloud (Azure, AWS ou GCP).
DevOps : Maîtrise de Git et des pratiques de CI/CD (Azure DevOps, GitHub Actions, etc.).
Souhaitées (Un plus) : Connaissances en MLflow, orchestration de modèles et pratiques MLOps.
Notions avancées en DataOps, cost optimization (FinOps) et outils de monitoring.
Expérience dans l?exploitation d?APIs et l'ingestion de données en temps réel (ex: Kafka).
Profil candidat:
Profil RecherchéFormation : Diplôme de niveau Bac+5 en informatique, ingénierie des données ou équivalent.
Expérience : 2 à 5 ans d?expérience réussie en Data Engineering, avec une spécialisation marquée sur la plateforme Databricks.
Savoir-être : Esprit d'équipe prononcé, sens aigu de la documentation, grande autonomie et d'excellentes qualités relationnelles et de communication.