Deep Learning, Machine Learning
Machine learning (apprentissage machine) et Apprentissage profond ou approfondi (Deep learning) sont deux composantes essentielles de l’intelligence artificielle. Alors que le Machine learning repose sur le fait que l’ordinateur reçoit des informations et les assimile (processus apprenant), le Deep Learning repose plutôt sur l’ordinateur qui appréhende les choses par lui-même (simulation d’un cerveau humain). Fondés sur des algorithmes sophistiqués, la principale différence qui les distingue est la structure de l’algorithme et des données qu’ils utilisent.
Deep et machine learning sont la conséquence directe de l’évolution de l’intelligence artificielle depuis que Alan Turing l’avait proposée dans ses travaux réalisés au milieu du XXe siècle. En 1935, Turing décrit une machine informatique abstraite constituée d’une mémoire illimitée et d’un scanner qui se déplace dans la mémoire, symbole par symbole, lisant ce qu’elle trouve et écrivant d’autres symboles. Les fondements de l’intelligence artificielle étaient établis et la recherche scientifique n’a fait que reprendre et développer ces fondamentaux pour aboutir au contexte complexe de l’intelligence artificielle que nous connaissons aujourd’hui dans ses différentes ramifications technologiques, industrielles mais aussi humaniste et transhumanistes.
L’IA dans son parcours d’évolution a intégré plusieurs autres innovations technologiques comme les Big data, l’algorithmie, les objets connectés, les réseaux neuronaux etc. Le Machine learning et le Deep learning, malgré leurs différences substantielles, sont parmi ces innovations clés sur lesquelles l’IA progresse et se développe.
Machine learning (apprentissage machine) :
Caractérisé par sa capacité à apprendre la réalisation des taches sans programmation préalable, le Machine Learning constitue un sous-ensemble de l’intelligence artificielle impliqué dans la création d’algorithmes qui peuvent se modifier sans intervention humaine. Autrement dit, le Machine learning est une application de l’intelligence artificielle qui offre aux systèmes la possibilité d’apprendre et de s’améliorer automatiquement à partir de données structurées sans être explicitement programmés. Ce qui sous-tend aussi que ce type d’application peut accéder aux données et les utiliser pour apprendre par lui-même.
Source : https://www.50a.fr/img/upload/machine%20learning.jpg
Dans notre monde d’aujourd’hui, nous sommes entourés, souvent sans nous en rendre compte, d’un grand nombre de systèmes utilisant le Machine learning. Par exemple, les assistants numériques recherchent à notre place sur le Web et nous livrent le résultat de leurs recherches sur la base d’une observation/apprentissage de nos habitudes et pratiques de recherche d’information. Des sites Web nous recommandent en permanence, via la publicité, des produits, des films et des chansons en fonction de ce que nous avons acheté, regardé ou écouté auparavant. Les logiciels anti-spams détectent et empêchent les e-mails indésirables d’échouer dans nos boîtes mail, etc. sans parler de technologies encore plus sophistiquées qui se profilent à l’horizon comme la voiture autonome qui prend la route sans programmation GPS préalable, etc. On doit d’ailleurs s’attendre à des technologies plus sophistiquées sous l’impulsion des Big Data qui ne cessent de grossir et des algorithmes qui deviennent de plus en plus performants.
Pour résumer le principe de fonctionnement du Machine learning, quatre étapes fondamentales sont sollicitées :
- Étape 1 : Sélectionner et préparez un ensemble de données d’entraînement : les données d’entraînement sont un ensemble de données représentatif des données que le modèle d’apprentissage automatique ingérera pour résoudre le problème qu’il est censé résoudre ;
- Étape 2 : Choisir un algorithme à exécuter sur l’ensemble de données d’entraînement ;
- Étape 3 : Entraînement de l’algorithme pour créer le modèle d’apprentissage ;
- Étape 4 : Utilisation et amélioration du modèle d’apprentissage.
Deep Learning (apprentissage profond ou approfondi) :
On l’aura compris : le Deep Learning est un sous-ensemble du Machine Learning, qui en revanche est un sous-ensemble de l’Intelligence Artificielle. L’IA est un terme général qui fait référence à des techniques qui permettent aux ordinateurs d’imiter le comportement humain.
Le Deep learning propose un autre aspect d’apprentissage machine dans lequel des algorithmes sont créés et fonctionnent de manière similaire à ceux du machine learning. Un Deep learning tente de tirer des conclusions similaires à celles des humains en analysant continuellement des données avec une structure logique donnée.
Les premières manifestations d’un Deep learning « surhumain » ont eu lieu lorsque « En 2017, AlphaGo, qui est l’IA développée par Google DeepMind et qui a commencé par ne connaître que les règles du jeu, a finalement pu faire ses preuves et devancer Ke Jie, le numéro 1 mondial à l’époque [dans ce jeu] très complexe que de nombreux programmeurs n’étaient pas en mesure d’éclipser avec l’IA dans le passé »[1].
Mais comment fonctionne le Deep learning et en quoi il et différent du machine learning ?
Pour fonctionner, le Deep learning utilise une structure multicouche d’algorithmes fournissant chacune une interprétation différente des données dont elle se nourrit. Cette interprétation contribue au processus d’apprentissage qui est optimisé par un réseau neuronal destiné à obtenir la meilleure représentation abstraite possible des données d’entrée. Cela signifie que les modèles d’apprentissage en profondeur, comparés aux modèles du Machine Learning, nécessitent peu ou pas d’effort manuel pour exécuter et optimiser le processus d’extraction de fonctionnalités. Ils sont constitués de systèmes informatiques capable d’« apprendre » sans surveillance avec des données non étiquetées ou non structurées.
Source : https://miro.medium.com/max/700/0*f1q97fOd6MRCrJg2
Un mot sur les réseaux neuronaux
Un réseau neuronal est ainsi nommé parce que son fonctionnement est une inspiration, si ce n’est une tentative d’imiter la fonction des réseaux neuronaux présents dans le cerveau humain.
Les réseaux de neurones ont l’obligation, tout comme le cerveau en développement d’un enfant, d’apprendre l’information. Les stratégies d’apprentissage utilisent trois méthodes :
- Un apprentissage supervisé : Cette stratégie d’apprentissage est la plus simple, car il existe un ensemble de données structurées, que l’ordinateur parcourt, et l’algorithme est modifié jusqu’à ce qu’il puisse traiter l’ensemble de données pour obtenir le résultat souhaité.
- Un apprentissage non supervisé : cette stratégie est utilisée dans les cas où aucun jeu de données structurées n’est disponible pour apprendre. Le réseau neuronal analyse l’ensemble de données, puis une fonction indique au réseau neuronal à quelle distance de l’objectif escompté il se trouvait. Le réseau neuronal s’ajuste alors pour augmenter la précision de l’algorithme.
- Un apprentissage renforcé : dans cet algorithme, le réseau neuronal est renforcé pour des résultats positifs et puni pour un résultat négatif, forçant le réseau neuronal à apprendre au fil du temps.
Ce type de réseau est composé de dizaines voire de centaines de « couches » de neurones, chacune recevant et interprétant les informations de la couche précédente. Ces couches sont capables d’apprendre une représentation implicite des données brutes directement et par elles-mêmes. Le système apprendra par exemple à reconnaître les lettres avant de s’attaquer aux mots dans un texte, ou de déterminer s’il y a un visage sur une photo avant de découvrir de quelle personne il s’agit, ou de distinguer un chat d’un chien dans une photo où plusieurs animaux sont représentés, etc.
Pour résumer :
La principale différence entre le Deep Learning et le machine learning provient de la façon dont les données sont présentées au système. Les algorithmes du machine learning nécessitent presque toujours des données structurées, tandis que les réseaux d’apprentissage profond reposent sur des couches d’un réseau neuronal (ANN : Artificial Neuronal Networks/réseaux de neurones artificiels) ;
Les algorithmes du Machine Learning sont conçus pour « apprendre » à faire des choses en comprenant les données structurées, puis les utiliser pour produire d’autres choses avec davantage de jeux de données. Cependant, ils doivent être recyclés grâce à une intervention humaine lorsque le résultat réel n’est pas celui souhaité.
Les réseaux Deep learning ne nécessitent pas d’intervention humaine car les couches imbriquées dans les réseaux de neurones placent les données dans des hiérarchies de différents concepts, qui finissent par apprendre grâce à leurs propres erreurs. Cependant, même ceux-ci sont sujets à des résultats défectueux si la qualité des données n’est pas suffisante. C’est la qualité des données qui détermine en définitive la qualité du résultat.
[1] Dark, Sebastian. Deep Learning : Une Introduction Aux Principes Fondamentaux de l’Apprentissage Profond À l’Aide de Python. Amazon Digital Services LLC – Kdp Print Us, 2018.
Sources consultées
- Baya-Laffite, Nicolas, et al. « Le deep learning au service de la prédiction de l’orientation sexuelle dans l’espace public ». Reseaux, vol. n° 211, nᵒ 5, La Découverte, novembre 2018, p. 137‑72.
- Bengio, Yoshua, et al. L’apprentissage profond. MASSOT EDITIONS, 2018.
- Campesato, Oswald. Artificial Intelligence, Machine Learning, and Deep Learning. Stylus Publishing, LLC, 2020.
- Cardon, Dominique, et al. « La revanche des neurones ». Reseaux, vol. n° 211, nᵒ 5, La Découverte, novembre 2018, p. 173‑220.
- Dark, Sebastian. Deep Learning : Une Introduction Aux Principes Fondamentaux de l’Apprentissage Profond À l’Aide de Python. Amazon Digital Services LLC – Kdp Print Us, 2018.
- December 17, Jonas P. DeMuro, et 2019. « What Is a Neural Network? » TechRadar, https://www.techradar.com/news/what-is-a-neural-network. Consulté le 2 décembre 2020.
- MASSARON, Luca, et John Paul MUELLER. Le Machine Learning Pour les Nuls. edi8, 2020.
- Mehul, Mahrishi, et al. Machine Learning and Deep Learning in Real-Time Applications. IGI Global, 2020.
- Mohanty, Aditya. « Neural Network Bits and Pieces: Why We Need Deep Learning For Unstructured Data ». Medium, 9 avril 2020, https://adityamohanty.medium.com/neural-network-bits-and-pieces-why-we-need-deep-learning-for-unstructured-data-92b785dae134.