Sujet de thèse CIFRE
Intelligence artificielle, fusion de données embarquées et personnalisation des alertes pour la prévention des risques routiers chez les deux-roues motorisés
Contexte scientifique et applicatif
Les conducteurs de deux-roues motorisés demeurent une population particulièrement vulnérable dans l’accidentalité routière. Malgré une part limitée dans le trafic global, ils représentent une proportion élevée des personnes tuées et blessées graves sur les routes. Les progrès généraux de sécurité routière observés ces dernières années ont moins bénéficié aux usagers vulnérables dont les deux-roues motorisés (2RM) qu’aux autres catégories d’usagers, ce qui justifie le développement de nouvelles approches de prévention, plus fines, plus prédictives et davantage adaptées aux usages réels.
Les travaux antérieurs, notamment autour du projet DYMOA+, ont montré l’intérêt des données embarquées pour analyser les situations de conduite, détecter des événements critiques et identifier des zones potentiellement à risque pour les deux-roues motorisés. Ces recherches ont ouvert la voie à une exploitation plus systématique des signaux issus de capteurs, mais elles étaient limitées par la taille des échantillons disponibles et par la difficulté à établir des liens robustes entre incidents, comportements de conduite, caractéristiques de l’infrastructure et accidents observés.
Depuis, le contexte a profondément évolué. Les données issues des smartphones, des systèmes airbags connectés, des applications de navigation et des capteurs embarqués se sont massivement développées. Liberty Rider dispose aujourd’hui d’une base de roulage très importante issue de son application mobile dédiée aux usagers de 2RM, intégrant notamment la détection d’accident, la navigation moto et des alertes liées aux zones dangereuses. In&Motion dispose également de données à forte valeur issues de ses systèmes airbags intelligents, intégrant notamment GPS, accéléromètres et gyromètres. Le croisement de ces sources avec des bases publiques d’accidentalité, des données météorologiques, de trafic et d’infrastructure crée une opportunité scientifique majeure : passer d’une analyse descriptive de l’accidentalité à une prévention individualisée, contextualisée et actionnable.
Problématique de recherche
L’enjeu central de cette thèse est de déterminer comment la fusion de données massives, hétérogènes et géoréférencées peut permettre d’identifier, de qualifier et de prédire les situations à risque pour les deux-roues motorisés, tout en adaptant les alertes aux profils de conduite des motards.
L’objectif de la thèse sera d’identifier clairement les verrous scientifiques et techniques pour permettre de répondre aux questions suivantes :
Comment consolider et exploiter des données multi-sources — accidents, incidents, trajectoires, signaux inertiels, météo, trafic, infrastructure — afin de construire une représentation fiable et exploitable du risque routier spécifique aux deux-roues motorisés ?
Comment développer des modèles d’intelligence artificielle capables de détecter et de classifier les zones et situations critiques, en distinguant les facteurs liés à l’infrastructure, à l’environnement, aux conditions de circulation et au comportement de conduite ?
Comment personnaliser les alertes et messages de prévention selon les profils de motards, leurs habitudes de conduite, leur exposition au risque et leur sensibilité aux différents types de dangers ?
Objectifs scientifiques
Le premier objectif consistera à construire un corpus multi-sources interopérable, associant les données issues de Liberty Rider, d’In&Motion, des bases d’accidents et de sources contextuelles externes. Cette étape devra traiter les enjeux de qualité, d’hétérogénéité, de synchronisation temporelle, de précision GPS, d’anonymisation et de comparabilité entre sources. Elle permettra d’identifier les complémentarités entre les bases disponibles, notamment pour repérer des accidents ou incidents non présents dans les bases institutionnelles.
Le deuxième objectif visera à modéliser la criticité des zones et situations de conduite. Les modèles devront intégrer plusieurs dimensions : fréquence des événements, gravité potentielle, récurrence, exposition au trafic deux-roues, caractéristiques de l’infrastructure, météo, saisonnalité et dynamique du véhicule. Les approches envisagées pourront combiner apprentissage supervisé, apprentissage non supervisé, modèles spatio-temporels, analyse de séries temporelles, classification d’événements et méthodes d’explicabilité. L’objectif ne sera pas seulement de détecter des zones dangereuses, mais de comprendre pourquoi elles le sont et dans quelles conditions elles le deviennent.
Le troisième objectif portera sur l’analyse des comportements individuels de conduite. À partir des trajectoires, freinages, accélérations, vitesses d’approche, prises d’angle, réactions en virage ou répétition de situations critiques, la thèse cherchera à établir des profils de conduite pertinents pour la prévention. Ces profils ne devront pas être conçus comme des catégories figées ou stigmatisantes, mais comme des représentations dynamiques permettant d’adapter le niveau, le moment, le canal et le contenu des alertes.
Le quatrième objectif concernera la personnalisation des alertes. Une même zone dangereuse ne présente pas nécessairement le même niveau de risque pour tous les motards : un conducteur novice, un utilisateur urbain quotidien, un motard expérimenté sur route sinueuse ou un usager roulant principalement par mauvais temps peuvent nécessiter des formes de prévention différentes. La thèse devra donc explorer des mécanismes d’alerte différenciés : alerte en amont d’un virage dangereux, message post-trajet, recommandation comportementale, score de vigilance, conseil contextualisé, gamification ou sensibilisation progressive. Un point central sera d’évaluer l’équilibre entre utilité, acceptabilité, charge cognitive et risque de lassitude face aux alertes.
Méthodologie envisagée
La démarche reposera d’abord sur la fusion de données géographiques, temporelles et comportementales. Les données de roulage et d’incident seront enrichies par des données d’accidentalité, de météo, de trafic et d’infrastructure. Des méthodes de nettoyage, d’alignement, de normalisation et de qualification des incertitudes seront nécessaires pour produire une base exploitable scientifiquement.
La modélisation du risque s’appuiera ensuite sur des approches d’intelligence artificielle adaptées aux données spatio-temporelles et aux signaux issus de capteurs embarqués. Les modèles devront permettre de détecter des événements critiques, de classifier les types de risques et d’établir une cartographie dynamique des zones à vigilance renforcée. L’explicabilité des modèles constituera un axe essentiel afin que les résultats soient interprétables par les chercheurs, les industriels, les collectivités et les gestionnaires d’infrastructure.
La personnalisation des alertes fera l’objet d’un volet spécifique. Il s’agira de construire des profils de conduite à partir de variables observables, puis de tester différentes stratégies de recommandation et de communication numérique. Les alertes pourront être évaluées selon leur pertinence contextuelle, leur capacité à modifier les comportements, leur acceptabilité utilisateur et leur potentiel de réduction des situations à risque. Cette évaluation pourra combiner analyses quantitatives, expérimentations en conditions réelles, retours utilisateurs et indicateurs de changement comportemental.
Contributions attendues
Cette thèse devrait produire plusieurs contributions scientifiques et opérationnelles.
Sur le plan scientifique, elle contribuera à la compréhension des liens entre incidents de conduite, accidents, infrastructure, environnement et comportements individuels chez les deux-roues motorisés. Elle proposera des méthodes de fusion de données massives adaptées à un contexte routier complexe, ainsi que des modèles d’intelligence artificielle explicables pour l’identification des risques.
Sur le plan applicatif, elle permettra de développer des outils de cartographie dynamique des zones à risque, utiles aux acteurs de la sécurité routière et aux gestionnaires de réseau. Elle ouvrira également la voie à des dispositifs d’alerte individualisés dans les applications de navigation moto, capables de prévenir le motard au bon moment, avec le bon niveau d’information et selon son profil de conduite.
Enfin, la thèse visera une transformation concrète des résultats de recherche en dispositifs de prévention. L’ambition n’est pas seulement de mieux connaître les risques, mais de les rendre actionnables : pour les collectivités, par une meilleure qualification des zones dangereuses ; pour les industriels, par des services de sécurité plus intelligents ; pour les usagers de 2RM, par une prévention personnalisée, compréhensible et utile en situation réelle de conduite.
Rémunération : à partir de 2 300,00€ par mois
Lieu du poste : Télétravail hybride (Toulouse (31))