Les spécialistes pensent que cela aidera les opérateurs touristiques et les secteurs liés au tourisme à prédire la sollicitation des stations balnéaires pour les périodes de vacances. Les résultats de l'étude ont été publiés dans la revue Journal of Ambient Intelligence and Humanized Computing.
Chaque jour les utilisateurs partagent sur les réseaux sociaux des photos, des publications, des commentaires et leur emplacement. Des chercheurs de l'université MISiS ont mené une étude qui consistait à prédire la prochaine destination des utilisateurs à partir de méthodes d'apprentissage automatique (machine learning) et d'analyse de mégadonnées (big data) recueillies à partir de sources ouvertes de données de Twitter. Les méthodes d'apprentissage automatique permettent à un ordinateur d'analyser les notes d'historique et de les utiliser pour prédire et prendre des décisions lors de la réception de nouvelles données.
«Nous avons utilisé non seulement les données ouvertes sur les voyages, mais également sur l'identité des voyageurs. Nous avons d'abord extrait des données de tous les tweets géolocalisés pour les classer. Sur un choix au hasard parmi 5.000 profils d'utilisateurs de différents pays européens (France, Allemagne, Suède, Espagne, Italie, Suisse, Pologne, Grèce et bien d'autres) ont été publiés plus de 800.000 tweets. Lors du tri des données, les catégories les plus visitées étaient la nourriture, les clubs de nuit, les gares, les églises et les plages. Pour chaque catégorie nous avons préparé un ensemble de données définies», a déclaré Marina Nejourina, auteure de l'étude, directrice de l'Institut des systèmes d'affaires de l'information à l'université MISiS.
«Pour chaque modèle de pronostic, la précision est un paramètre critique et obligatoire. Si le modèle de pronostic ne garantit pas une bonne précision, il ne peut être reconnu comme fiable. C'est pourquoi nous avons utilisé la méthode de classification d'ensemble réunissant les résultats de tous les classificateurs de base», a déclaré Sachin Kumar, auteur de l'étude, chercheur postdoctoral à l'université MISiS.
D'après les chercheurs, un pronostic plus concret pourra être obtenu en recueillant les paramètres comme la citoyenneté, le sexe et l'âge des utilisateurs. La prochaine étape du travail consistera à analyser et à bâtir des modèles à l'aide de méthodes d'ensemble d'apprentissage automatique.