ContexteOnSpark est un cabinet spécialisé dans la GMAO/EAM et l'intégration SI, en forte croissance (40 collaborateurs, CA 3,3 M?). Dans le cadre de la diversification de son offre vers la Data et l'Intelligence Artificielle, nous recherchons un Data Scientist pour accompagner nos clients grands comptes. Vous travaillerez sur des données massives et complexes, et contribuerez à des cas d'usage à fort impact : modèles de prévision, simulateurs, analyses statistiques avancées, détection de tendances, dans un environnement Big Data on-premise (Cloudera CDP, Cloudera Machine Learning) avec accès à des IDE modernes (Jupyter, RStudio, VSCode).
ResponsabilitésConcevoir et entraîner des modèles de Machine Learning et Deep Learning
Analyser des jeux de données complexes et volumineux
Collaborer avec les Data Engineers pour la mise en production des modèles
Accompagner les équipes métier dans l'interprétation des résultats
Contribuer aux cas d'usage IA et NLP de la plateforme
Profil candidat:
Profil recherchéFormation Bac+5 (Data Science, Statistiques, Mathématiques ou équivalent)
Maîtrise de Python (Pandas, Scikit-learn?) et/ou R
Expérience en Machine Learning, Deep Learning, NLP
Connaissance des environnements Big Data (Spark, Hadoop, Cloudera?)
Connaissance du secteur public ou de la protection sociale appréciée
ConditionsPrésence physique requise à Paris 12ème (télétravail partiel possible, jusqu'à 2 jours/semaine)
Mission longue durée avec possibilité d'intégration en CDI