« En matière de prédictions basées sur des données, le Machine Learning semble avoir le vent en poupe. Ses partisans mettent en avant l’adaptabilité de ces méthodes et leur capacité à produire des prédictions meilleures que la plupart des méthodes alternatives. Ses détracteurs lui opposent l’opacité de ses mécanismes sous-jacents qui sont à la base de ces algorithmes… Qui a raison ?
Le Machine Learning ou Apprentissage Automatique
Issues des techniques d’intelligence artificielle, les méthodes du Machine Learning (en français « Apprentissage Automatique ») permettent à une machine « d’apprendre » d’une manière plus ou moins autonome. Cet apprentissage est basé sur des algorithmes très complexes – parfois chaotiques – où les meilleures prédictions (ou comportement si on fait l’analogie avec un organisme pensant) sont encouragées et renforcées.
Le Machine Learning, c’est la mise en œuvre systématique du principe du Chien de Pavlov. Imaginons qu’un robot soit mis au centre d’un labyrinthe à la recherche d’un objet. Si son comportement est positif, par exemple s’il trouve l’objet rapidement, la machine est « récompensée » et la méthode « gagnante » est renforcée. A l’inverse, tant que le comportement n’est pas jugé satisfaisant, la machine peut être « punie » et l’algorithme « continuera à chercher ».
A force d’essais et d’erreurs, la machine pourra alors déterminer la manière systématique d’arriver à son objectif, et apprendre une façon de faire, c’est-à-dire un modèle. L’une des méthodes les plus célèbres est par exemple l’Arbre de Décision, qui a une structure que l’on peut résumer à une série de « Si… Alors… » ; chaque condition constituant les « branches » de l’arbre.
Il faut noter que dans cette recherche systématique du meilleur algorithme, le hasard a une part importante. Le Chien de Pavlov recherche son os, mais il ne sait pas toujours où chercher. Il peut donc partir dans une direction qui n’est pas la bonne dans un premier temps et son comportement peut avoir l’air erratique. Si, petit à petit, il finira par converger vers son objectif, le processus dans son ensemble n’en est pas moins chaotique…
L’objet de l’apprentissage automatique peut être de nature diverse. On peut chercher à optimiser un comportement : les exemples récents les plus célèbres sont les voitures robots qui « apprennent à conduire » de cette manière. Mais on peut aussi utiliser ces techniques pour qu’un ordinateur « apprenne à prédire » des valeurs plus abstraites, comme un scoring marketing par exemple
Des qualités d’adaptabilité et de précision inégalées…
Et c’est là la première grande force du Machine Learning : il peut s’appliquer à toute sorte de prédictions. De la médecine au marketing en passant par la conduite, les ordinateurs peuvent nous aider dans bien des domaines, et quand ils sont capables « d’apprendre automatiquement » les applications sont virtuellement infinies. Rien qu’en marketing, du scoring crédit à la prédiction d’un comportement d’attrition, les algorithmes de Machine Learning ont démontré leur utilité depuis de nombreuses années.
Et c’est là la deuxième grande force du Machine Learning : sa capacité à prédire mieux que la plupart des autres méthodes les comportements futurs. Quand on compare la précision des prédictions fournies, ces méthodes sont quasiment systématiquement en tête des classements par rapport aux techniques de statistiques « classiques ».
Leur précision est encore améliorée quand plusieurs algorithmes sont mis en parallèle et leurs prédictions comparées lors de ce qu’on appelle des méthodes d’ensemble. Un des exemples les plus anciens est utilisé dans l’aviation : il est possible de faire atterrir un avion automatiquement à l’aide d’un ordinateur. Mais comme c’est un problème complexe, pourquoi ne pas plutôt utiliser trois ordinateurs qui donnent chacun leur avis sur la meilleure façon d’atterrir et prendre le choix « le plus sûr » ? Faire « voter » un ensemble d’algorithmes garantit la qualité de la prédiction. C’est ce qui a donné ses lettres de noblesses à l’une des méthodes les plus utilisées dans ce domaine, ou des centaines d’arbres de décisions (des forêts aléatoires) sont mis en concurrence pour trouver la solution optimale.
… au prix de la clarté et de la fiabilité » […]
Retrouver l’intégralité de la tribune de Nicolas Glady, titulaire de la Chaire Accenture Strategic Business Analytics de l’Essec
Source : silicon.fr