Depuis des années, les enseignants-chercheurs de l’ESILV s’attachent à comprendre et à améliorer le secteur du tourisme grâce au big data, à travers les travaux menés par le De Vinci Research Center. C’est dans ce contexte que l’article de recherche « Indicators for Measuring Tourist Mobility », co-écrit par deux enseignants et un étudiant de l’ESILV, s’est illustré dans le cadre de la conférence WISE 2020, un événement international de rang A, la classification la plus selective dans la recherche en informatique.
Analyser le comportement touristique à partir des données provenant des réseaux sociaux prescripteurs tels que Tripadvisor est l’une des grandes préoccupations du groupe Digital du De Vinci Research Center – DVRC, le centre de recherche transversale du Pôle Léonard de Vinci.
Des partenariats de longue durée autour du big data dans le tourisme
Ces travaux de longue haleine ont été engagés dans le cadre de partenariats développés par l’ESILV avec différentes métropoles françaises autour des liens entre réseaux sociaux, big data et tourisme.
Le plus récent en date est le projet « Big Data & Tourism », un partenariat R&D entre le De Vinci Research Center et la Métropole Européenne de Lille (MEL).
Les derniers travaux, produits par Sonia Djebali et Nicolas Travers, enseignants-chercheurs à l’ESILV, membres du groupe Digital du De Vinci Research Center, et Nicolas Loas, promo 2021, ont été présentés à l’occasion de l’événement WISE 2020, Web Information Systems Engineering.
Une conférence internationale très bien cotée dans le monde de la recherche
Cette conférence internationale de rang A, très bien cotée dans la recherche en informatique, met en avant les efforts des chercheurs dans les sujets liés aux systèmes d’information sur le Web : analyse, machine learning, optimisation, traitement des données. Chaque année, elle s’impose comme un espace international privilégié, où les chercheurs, les professionnels et les industriels partagent leurs connaissances et points de vue dans les domaines en pleine croissance des technologies du Web.
Cet événement de quatre jours s’est déroulé en ligne, pour la première fois depuis 2000 et regroupe une sélection de travaux classés en 7 catégories : network embedding, graph neural network, social network, graph query, knowledge graph and entity linkage, spatial temporal data analysis, service computing and cloud computing.
Dans la catégorie « spatial temporal data analysis » on retrouve l’article co-signé par Sonia Djebali, Nicolas Loas et Nicolas Travers.
« Indicators for Measuring Tourist Mobility »
Les traces numériques laissées par les utilisateurs actifs sur les réseaux sociaux sont devenues un moyen populaire d’analyser le comportement des touristes. La grande quantité de données générées par les touristes fournit un indicateur clé pour comprendre leur comportement selon différents critères. Les analyses de la circulation des touristes ont un rôle crucial dans le marketing du tourisme pour renforcer les outils de prise de décision pour les professionnels du tourisme.
L’article « Indicators for measuring tourist mobility » vise une approche bidirectionnelle. D’un côté, il propose une méthodologie de manipulation de graphes géodésiques (géographie + temps) à différentes échelles, et de l’autre, il fournit les analyses nécessaires pour comprendre la manière dont les touristes circulent sur le territoire basé sur les graphes.
Le premier aspect repose sur une base de données orientée graphe Neo4j qui permet de fournir la possibilité de manipuler les graphes, ici un réseau de zones géographiques (villes, cantons, départements, pays). Ainsi, ils sont à même de produire différents graphes, en faisant varier les années et les nationalités. Par exemple, ils ont été en mesure de produire le graphe de circulation des touristes sur la Gironde par les Anglais, et le comparer à celui des Français.
La seconde étape consiste à prendre deux graphes sur une même zone et les rendre comparables. Pour cela, ils reposent sur un algorithme sur les graphes mesurant la centralité des nœuds, en particulier le PageRank (créé par Google en 2007), en produisant un nouveau facteur de comparaison de graphes : le Circulation Factor. Ainsi, les deux enseignants et l’étudiant ESILV sont à même de comparer les circulations différentes nationalités ou l’évolution annuelle.
La contribution de ce travail est donc double : construction d’une base de données favorisant la manipulation de graphes géodésiques, et une mesure de comparaison de graphes géodésiques.
Ces travaux sur les graphes de circulation touristique ouvrent de nouvelles pistes de recherche, telles que des études de propagation sur ces graphes et l’implémentation de nouveaux algorithmes de centralité dans les bases de données graphes. Grâce à ces nouvelles méthodologies de calcul et à ces outils innovants d’analyse géographique et spatiale, ce projet de recherche fournit aux acteurs de tourisme plusieurs pratiques de traitement des données grâce au Big Data.
La récompense d’un très bon parcours au sein du De Vinci Research Center
Nicolas Loas, promo 2021, a commencé ces travaux dans le cadre de son parcours Recherche au sein du De Vinci Research Center, lors de sa 4e année du cycle ingénieur.
« Mon rôle dans l’article fut en deux parties, la première centrée sur l’état de l’art. Cela consiste à trouver un maximum de travaux déjà réalisés dans le domaine qui concerne notre projet, dans notre cas c’était focalisé sur l’analyse de graphe mais également sur l’analyse de comportement touristiques.
La deuxième partie quant à elle était centrée sur les expérimentations. Cette partie consistait à effectuer les différents calculs sur nos données touristiques existantes. C’est une étape très rigoureuse, car en effet on n’est jamais à l’abri de faire des erreurs dans les calculs et nous sommes responsables de la validité de nos résultats. »
L’écriture de cet article pour la conférence WISE a été pour moi la meilleure expérience dans le cadre de mon parcours recherche, aussi bien au niveau personnel que professionnel.
Il faut aussi préciser que la publication d’un article dans une conférence ou une revue scientifique est une validation de notre travail de recherche et est donc vraiment encourageante, c’est une vraie reconnaissance de notre contribution à la communauté scientifique », précise Nicolas, étudiant de la majeure Informatique, objets connectés et sécurité.