[L’usine Digitale] Les Big data ont-elles vraiment un avenir industriel ?

Selon deux chercheurs du CNRS, les big data ont bien des applications industrielles. Elles passent par la définition de modèles prédictifs mathématiques issus de données réelles, plus fiables que la simulation.

Hypermédiatisées, les Big data sont de toutes les conférences, de tous les programmes de recherche ou industriels. C‘est même, en France, la seule technologie qui fasse à la fois l’objet d’un des 34 plans de la nouvelle France Industrielle d’Arnaud Montebourg et d’une des 7 ambitions pour faire émerger des champions nationaux, avancées pour la commission France 2030 d’Anne Lauvergeon. Mais de quoi parle-t-on ?

« On parle de Big data, quand il y a nécessité de distribuer le stockage et le traitement des données. Il est donc nécessaire d’inventer de nouveaux modèles de BDD, en passant des modèles classiques relationnels, ou SQL (Structured Query Language), à des modèles NoSQL (not only SQL) », explique Aurélien Garivier, enseignant chercheur à l’Institut Mathématique de Toulouse (IMT) CNRS UMR. En clair lorsque l’on ne sait plus donner du sens à l’avalanche de données, que l’on ne collectait pas auparavant. Des données numériques produites à profusion par les internautes, mais surtout demain, par les milliards d’objets connectés.

S’affranchir des lois physiques

« Le premier grand défi, le stockage, est en passe d’être gagné », rassure le chercheur. Les bases de données NoSQL, qui garantissent aussi l’intégrité des données, facilitent un traitement distribué. Et pour éviter d’avoir un grand chaos programmatique, « on pense la tâche en ‘MapReduce’, c’est-à-dire en divisant les calculs en petites sous tâches, qui renvoient chacune leur résultat, ensuite regroupés pour produire le résultat final. » Le cloud (location de serveur, d’espace de stockage et de calcul, voir de logiciel à la demande) limitant les investissements.

L’idée des Big data, c’est qu’à partir de ces données, on peut extraire de l’information. Ce qui est nouveau, c’est que « Le Big data ne tient pas compte de la physique, mais des données de capteurs, pour extraire des comportements. Il remplace des modèles préconçus par ce que l’on observe directement. On réinvente la physique », résume Aurélie Garivier.

« Certes, l’idée n’est pas nouvelle et les technologies de ‘machine learning’ (ou apprentissage automatique) permettaient déjà à des systèmes de trouver les meilleurs réglages, à partir de données réelles, reconnaît Jean-Michel Loubes, enseignant chercheur CNRS -Université Montpellier. Mais le big data donne beaucoup plus d’importance aux choix des variables que l’on garde. Et cela permet d’observer ce qui se passe lorsqu’elles bougent ensemble. »

Prédire un comportement, pas l’expliquer

Sur cette idée, Airbus, envisage de changer de mode de reporting en vol et de multiplier les capteurs dans les avions pour identifier les comportements normaux de vol, sans connaissance a priori, pour après mener un suivi temps réel.

L’aéronautique n’est bien sûr pas la seule industrie qui peut tirer partie des Big data. Mais c’est l’une des rares à afficher son ambition, tant le potentiel est stratégique. « Ainsi, les constructeurs d’auto pourraient en temps réel, prévoir les pannes d’une voiture dès lors qu’elle sera connectée », annonce Jean-Michel Loubes. Idem pour tous les fabricants de machines, qui rendront ainsi la maintenance prédictive bien plus efficace. Ou encore les fournisseurs d’énergie, qui à partir des compteurs intelligents pourront fournir des indications pour optimiser autant les réglages de chauffage que les outils de production, comme le prévoit GRDF.

Mais attention, « si le Big data permet de prédire ce qui va se passer, il n’explique pas pourquoi », rappelle Aurélie Garivier. Pas facile à admettre pour des ingénieurs. La raison sans doute pour laquelle, aujourd’hui, seule l’industrie numérique sait exploiter le Big data, en affinant sans cesse les systèmes marketing de recommandation.

Les 5 V du Big data

Le cabinet McKinsey a déterminé 5 paramètres, ou « 5V » qui font qu’il s’agit de big data :

Vélocité (flux),
Variété ou variabilité (hétérogénéité des donnes),
Véracité (les données sont-elles propres, exactes, qualité de la donnée),
Valeur (quelle valorisation de ces données)
Volume.

Par Aurélie Barbaux

Source : usine-digitale.fr

Laisser un commentaire