X

Best Paper Award in Advanced Data Mining and Applications pour le Groupe Digital

Julien, promo 2022, Imen Ouled Dlala et Nicolas Travers, les deux enseignants-chercheurs à l’ESILV, membres du Groupe Digital du De Vinci Research Center, sont les co-auteurs d’un article de recherche récompensé par les scientifiques de la conférence internationale ADMA 2022, Advanced Mining and Applications.

Julien Martin-Prin, promo 2022, encadré par Imen Ouled Dlala et Nicolas Travers, a remporté le prix du meilleur article de recherche de la conférence ADMA 2022.

La 18e édition de cette conférence internationale de prestige a eu lieu du 28 au 30 novembre à Brisbane, en Australie. Nicolas Travers, enseignant-chercheur, membre du Groupe Digital, a participé à la conférence pour présenter ce travail.

Dr. Guangdong Bai, Senior Lecturer @ University of Queensland et Nicolas Travers, enseignant-chercheur ESILV, à la conférence ADMA

Une reconnaissance des travaux du Groupe Digital dans le cadre de la conférence ADMA

Julien est étudiant de la majeure Objets connectés & cybersécurité. C’est dans le cadre de son parcours Recherche au De Vinci Research Center, qu’il a pu s’intéresser à l’impact du big data dans le tourisme et apporter sa contribution aux travaux du Digital Group.

ADMA est la conférence internationale sur les applications de la fouille de données (International Conference on Advanced Data Mining and Applications 2022) avec un fort impact à l’international.

Dans ce contexte, l’article de recherche « A Distributed SAT-based Framework for Closed Frequent Itemset Mining » accepté pour publication dans la conférence 18th International Conference on Advanced Data Mining and Applications 2022 (ADMA) a reçu le prix du meilleur article lors de la session plénière.

Une contribution scientifique à la fouille de données complexes

La fouille de données vise à extraire des connaissances à partir de bases de données. Il s’agit notamment de rechercher des motifs récurrents dans des données ensemblistes où chaque donnée est décrite par un ensemble de caractéristiques. Les critères utilisés pour définir les motifs (fréquence, fermeture, maximalité, etc.) sont généralement facilement modélisables en termes de contraintes.

Des approches déclaratives et flexibles ont été proposées pour modéliser et extraire des motifs : cela permet à l’utilisateur de facilement décrire les critères, en termes de contraintes, et d’utiliser la machinerie algorithmique de ces formalismes pour extraire les motifs satisfaisant ces critères.

Toutefois, la contrepartie à cette grande généricité est simple : elle ne passe pas à l’échelle ! En d’autres termes, elle ne permet pas de traiter d’énormes volumes de données.

Ainsi, le but de ce travail est de permettre aux méthodes de fouille de données de traiter de grands volumes de données.

Qui plus est, nous nous focalisons dans cette étude aux énormes volumes de données touristiques que nous utilisons dans nos travaux sur l’analyse de comportement touristique [WISE’2019, WISE’2020, Mondes du Tourisme 2018 & 2021, SAC’2022].

L’intelligence artificielle symbolique au service du tourisme

Ici, nous cherchons à énumérer les lieux de visites des touristes qui sont fréquemment visités ensemble ce qui permet aux acteurs du tourisme de comprendre les interconnexions entre les destinations fréquentes.

Les données touristiques provenant de sites prescripteurs d’expérience tels que TripAdvisor est souvent volumineuse ce qui limite l’efficacité des approches déclaratives.

Afin de pallier ce problème, nous avons proposé une approche distribuée basée sur une stratégie de décomposition de l’espace de recherche des visites des touristes. Cette stratégie utilise un paradigme distribué par calcul pour énumérer efficacement l’ensemble des motifs fréquents, en réduisant le temps de traitement et en particulier les communications entre les tâches (effectuées par les Solver Nodes).

A notre connaissance, cet article présente la première tentative vers une approche distribuée basée sur l’Intelligence Artificielle Symbolique (SAT) pour l’énumération des motifs fréquents à partir des bases de données transactionnelles. Une évaluation empirique approfondie sur les données touristiques montre l’efficacité de notre approche.

En savoir davantage sur la majeure Objets connectés et Cybersécurité

Connaître les travaux du Digital Group

Categories: Recherche
Related Post