BigDataFr recommande : Résumer efficacement des flux de données massifs en fenêtre glissante
Résumé
[…] Estimer la fréquence de n’importe quel item dans des flux de données massifs est un des problèmes majeurs de la dernière décennie. Si plusieurs solutions élégantes ont été proposées récemment, leur approximation est calculée depuis le commencement du flux. Dans un contexte applicatif en ligne, il serait préférable de collecter l’information sur un passé récent, tant pour économiser des ressources que par pertinence de l’information la plus récente. Dans cet article, nous considérons le modèle dit de fenêtre glissante et proposons deux algorithmes en ligne qui estiment la fréquence de chaque item dans la fenêtre courante. […]
Lire le document
Nicolò Rivetti 1 Yann Busnel 2,3 Javier Alfonso Espinosa Oviedo 2Achour Mostefaoui 1
Source: hal-archives-ouvertes.fr
1 LINA – Laboratoire d’Informatique de Nantes Atlantique
2 ENSAI – Ecole Nationale de la Statistique et de l’Analyse de l’Information
3 DIONYSOS – Dependability Interoperability and perfOrmance aNalYsiS Of networkS
IRISA-D2 – RÉSEAUX, TÉLÉCOMMUNICATION ET SERVICES, Inria Rennes – Bretagne Atlantique