Résumé
Le consultant Data Scientist / Data Engineer aura pour mission de concevoir et optimiser des systèmes de machine learning pour le traitement et l'analyse de données à partir de sources multi-données.
Ce que nous recherchons
Excellentes compétences en Python, avec une maîtrise de Polars et/ou Pandas.
Expérience en traitement automatique du langage naturel (NLP) et en fine-tuning de modèles de machine learning légers.
Expérience en Scala et Apache Spark pour les parcours orientés Data Engineering.
Capacité à concevoir, développer et évaluer des pipelines de données.
Familiarité avec les frameworks d?agents IA, notamment LangGraph.
Capacité à adapter et évaluer des systèmes de machine learning sur différents contextes géographiques, linguistiques et domaines de données.
Expérience dans l?orchestration et l?optimisation de pipelines pour l?ingestion de données à grande échelle provenant de multiples sources.
Profil candidat:
Exemple de tâches de travail
Construire des pipelines Spark pour récupérer du contenu web en utilisant des fine-tuned lightweight ML models.
Fine-tuner des modèles de ML à partir de modèles de base afin d?effectuer de l?extraction d?attributs spécifiques à une tâche ; construire des données d?entraînement, gérer la qualité des données et évaluer les performances de bout en bout ainsi qu?au niveau de chaque composant.
Étendre un agent de recherche IA interne à de nouveaux marchés géographiques, en adaptant la logique et en évaluant les performances selon les zones locales ; ajouter la prise en charge de nouveaux attributs liés aux lieux, incluant la collecte de preuves et des mécanismes de raisonnement.
Autres détails :
Courte mission (3 mois)
Démarrage ASAP, full sur site
Anglais : fluent