La personne recrutée aura pour principale mission de contribuer au développement des activités du projet ReligiS dans l’axe 6 Gestion des données et humanités numériques, en lien avec les activités des axes scientifiques. L’axe 6 a pour objectif de soutenir la réflexion sur le sujet "Religion et Numérique" et d’apporter un soutien coordonné pour garantir une structuration adéquate des données acquises ou produites, conformément aux principes internationaux de la science ouverte.
Il s’agira notamment, pour la personne recrutée, d’analyser les représentations et les circulations du fait religieux sur le web, en mobilisant les formats d’archivage standards (WARC, WAT, WET) et avancés (WANE), à partir de sources comme Spark Internet Archive ou des collectes ciblées de la BNF.
- Participer à la structuration, l’enrichissement sémantique, l’indexation et l’analyse des archives collectées à grande échelle ;
- Collaborer avec les chercheurs en SHS du projet ;
- Webscraping, développement d’outils pour extraire, transformer et indexer les contenus (métadonnées, textes, entités) ;
- Intégrer des outils de traitement automatique du langage (NLP) pour l’extraction d’entités nommées (NER) ;
- Structurer les données, les analyses et les visualiser (ElasticSearch ou SolR, MongoDB, graphes) ;
- Rédiger la documentation technique, mettre en place des démonstrateurs, assurer la publication des corpus et l’analyse des données.
Savoirs :
- Master en ingénierie des données, humanités numériques ou domaine proche ;
- Très bonne connaissance de l’IR* Huma-Num ;
- Maîtrise de Python, R, de l’écosystème data science (pandas, spaCy, NLTK, json, warcio…) ;
- Expérience en manipulation de données massives, en ligne de commande, et en environnement Unix ;
- Compétences en traitement de texte, NLP, extraction d’entités, indexation ;
- Connaissance des outils open source, des ressources issues de Common Crawl, du DLWeb BnF et des environnements de calcul sur serveurs ou cloud académique (JupyterHub, Apache Spark) ;
- Maîtrise des outils de gestion de codes et de management de projet (GitLab) ;
- Capacité à rédiger des documentations techniques et utilisateurs.
Savoir-faire :
- Traitement de corpus web massifs et en fouille sémantique
- Identifier, filtrer et manipuler les formats d’archives web : WARC, WAT, WET, WANE ;
Savoir-être :
- Aptitude à collaborer avec des acteurs de l’ESR en SHS.
- Sens de l’organisation, rigueur et méthode.
- Esprit d’initiative et dynamisme.
- Capacité à travailler en autonomie tout en rendant compte
- Capacité à travailler en équipe et en réseau.
Le programme ReligiS (Religions et sociétés face aux défis contemporains) est un projet structurant en sciences humaines et sociales (SHS) financé par l’État dans le cadre des investissements d’avenir (France 2030) pour 6 ans (avril 2025-mars 2031). Il est porté par l’Université de Strasbourg et s’appuie sur un consortium de 12 partenaires académiques français (CNRS, Aix-Marseille Université, École pratique des Hautes Etudes, École des Hautes Etudes en Sciences Sociales, Ecole normale supérieure de Lyon, Institut national des langues et civilisation orientales INALCO, Sciences Po Paris, Université de Lorraine, Université Lyon 2, Université Lyon 3, École française d’Athènes, Bibliothèque nationale universitaire Strasbourg) et de nombreuses parties prenantes nationales et internationales (universités internationales, collectivités locales, administrations, CHU, associations…). ReligiS se concentre sur l’étude de la transformation des interactions entre les religions et les sociétés dans le monde contemporain, dans une perspective à long terme. D'une part, dans le contexte académique français, il entend développer un nouveau cadre scientifique, résolument ouvert, interdisciplinaire et international, afin de repenser les processus de transformation des relations entre religions et sociétés. D'autre part, il vise à créer les conditions institutionnelles d'un changement à grande échelle des mécanismes et des actions de transfert des connaissances académiques sur les religions vers les décideurs politiques et la société.
L’ingénieur/e travaillera en lien avec l’équipe de direction du projet, les responsables de l’axe 6, les partenaires du projet, ainsi que, le cas échéant, avec les plateformes SHS du site. La personne recrutée pourra s’appuyer sur un réseau d’expertise que l’IR* Huma-Num met en place autour des programmes de recherche structurants (PEPR, AMI-SHS, etc.), afin de mutualiser méthodes, référentiels et retours d’expérience.
Situé sur le Campus principal de l’Unistra à Strasbourg, son environnement de travail de proximité est celui de la MISHA et des plateformes SHS du site ainsi que la bibliothèque universitaires (BNUS).
Le poste pourra bénéficier d'une journée de télétravail par semaine.
Rémunération entre 2571 et 3817 euros bruts mensuels selon expérience
44 jours
Pratique et indemnisation du TT
Prise en charge à 75% du coût et forfait mobilité durable jusqu’à 300€
Référence de l’offre
UAR3598-ARIALL-046
Secteur d’activité
Sciences Humaines et Sociales
Emploi type
Ingenieur d'etudes en production, traitement, analyse de donnees et enquetes (H/F)
Le CNRS est un acteur majeur de la recherche fondamentale à une échelle mondiale. Le CNRS est le seul organisme français actif dans tous les domaines scientifiques. Sa position unique de multi-spécialiste lui permet d’associer les différentes disciplines pour affronter les défis les plus importants du monde contemporain, en lien avec les acteurs du changement.
Le CNRS
Les métiers de la recherche