Apprentissage automatique - Catégories

L'apprentissage automatique est globalement classé sous les rubriques suivantes:

L'apprentissage automatique a évolué de gauche à droite, comme indiqué dans le diagramme ci-dessus.

  • Au départ, les chercheurs ont commencé par l'apprentissage supervisé. C'est le cas de la prévision des prix des logements évoquée plus haut.

  • Cela a été suivi d'un apprentissage non supervisé, où la machine est amenée à apprendre par elle-même sans aucune supervision.

  • Les scientifiques ont en outre découvert que cela peut être une bonne idée de récompenser la machine lorsqu'elle fait le travail de la manière attendue et que l'apprentissage par renforcement est arrivé.

  • Très vite, les données disponibles de nos jours sont devenues si gigantesques que les techniques conventionnelles développées jusqu'à présent n'ont pas réussi à analyser les mégadonnées et à nous fournir les prévisions.

  • Ainsi, est venu l'apprentissage profond où le cerveau humain est simulé dans les réseaux de neurones artificiels (ANN) créés dans nos ordinateurs binaires.

  • La machine apprend désormais par elle-même en utilisant la puissance de calcul élevée et les énormes ressources mémoire disponibles aujourd'hui.

  • On observe maintenant que le Deep Learning a résolu de nombreux problèmes auparavant insolubles.

  • La technique est maintenant encore plus avancée en donnant des incitations aux réseaux de Deep Learning sous forme de récompenses et vient enfin le Deep Reinforcement Learning.

Étudions maintenant chacune de ces catégories plus en détail.

Enseignement supervisé

L'apprentissage supervisé est analogue à la formation d'un enfant à la marche. Vous tiendrez la main de l'enfant, lui montrerez comment faire avancer son pied, vous marcherez vous-même pour une démonstration et ainsi de suite, jusqu'à ce que l'enfant apprenne à marcher seul.

Régression

De même, dans le cas de l'apprentissage supervisé, vous donnez des exemples concrets connus à l'ordinateur. Vous dites que pour une valeur de caractéristique donnée x1, la sortie est y1, pour x2 c'est y2, pour x3 c'est y3, et ainsi de suite. Sur la base de ces données, vous laissez l'ordinateur déterminer une relation empirique entre x et y.

Une fois que la machine est entraînée de cette manière avec un nombre suffisant de points de données, vous demandez maintenant à la machine de prédire Y pour un X donné.En supposant que vous connaissez la valeur réelle de Y pour ce X donné, vous pourrez en déduire si la prédiction de la machine est correcte.

Ainsi, vous testerez si la machine a appris en utilisant les données de test connues. Une fois que vous êtes convaincu que la machine est capable de faire les prédictions avec un niveau de précision souhaité (disons 80 à 90%), vous pouvez arrêter la formation continue de la machine.

Maintenant, vous pouvez utiliser la machine en toute sécurité pour faire les prédictions sur des points de données inconnus, ou demander à la machine de prédire Y pour un X donné pour lequel vous ne connaissez pas la valeur réelle de Y. Cet entraînement relève de la régression dont nous avons parlé plus tôt.

Classification

Vous pouvez également utiliser des techniques d'apprentissage automatique pour les problèmes de classification. Dans les problèmes de classification, vous classez les objets de nature similaire dans un seul groupe. Par exemple, dans un ensemble de 100 élèves, disons, vous aimeriez peut-être les regrouper en trois groupes en fonction de leur taille - courte, moyenne et longue. En mesurant la taille de chaque élève, vous les placerez dans un groupe approprié.

Désormais, lorsqu'un nouvel élève arrive, vous le placerez dans un groupe approprié en mesurant sa taille. En suivant les principes de l'entraînement à la régression, vous entraînerez la machine à classer un élève en fonction de sa caractéristique - la hauteur. Lorsque la machine apprendra comment les groupes sont formés, elle sera en mesure de classer correctement tout nouvel étudiant inconnu. Encore une fois, vous utiliserez les données de test pour vérifier que la machine a appris votre technique de classification avant de mettre le modèle développé en production.

L'apprentissage supervisé est l'endroit où l'IA a vraiment commencé son voyage. Cette technique a été appliquée avec succès dans plusieurs cas. Vous avez utilisé ce modèle lors de la reconnaissance manuscrite sur votre machine. Plusieurs algorithmes ont été développés pour l'apprentissage supervisé. Vous en apprendrez plus sur eux dans les chapitres suivants.

Apprentissage non supervisé

Dans l'apprentissage non supervisé, nous ne spécifions pas de variable cible à la machine, nous demandons plutôt à la machine «Que pouvez-vous me dire sur X?». Plus précisément, nous pouvons poser des questions telles que, étant donné un énorme ensemble de données X, "Quels sont les cinq meilleurs groupes que nous pouvons faire de X?" ou «Quelles fonctionnalités se produisent le plus souvent ensemble dans X?». Pour arriver aux réponses à de telles questions, vous pouvez comprendre que le nombre de points de données dont la machine aurait besoin pour déduire une stratégie serait très important. En cas d'apprentissage supervisé, la machine peut être entraînée avec même quelques milliers de points de données. Cependant, en cas d'apprentissage non supervisé, le nombre de points de données raisonnablement acceptés pour l'apprentissage commence à quelques millions. De nos jours, les données sont généralement disponibles en abondance. Les données doivent idéalement être conservées. Cependant, la quantité de données qui circule en permanence dans un réseau social, dans la plupart des cas, la conservation des données est une tâche impossible.

La figure suivante montre la limite entre les points jaunes et rouges, déterminée par l'apprentissage automatique non supervisé. Vous pouvez voir clairement que la machine serait capable de déterminer la classe de chacun des points noirs avec une assez bonne précision.

La source:

https://chrisjmccormick.files.wordpress.com/2013/08/approx_decision_boun dary.png

L'apprentissage non supervisé a connu un grand succès dans de nombreuses applications d'IA modernes, telles que la détection de visage, la détection d'objet, etc.

Apprentissage par renforcement

Pensez à former un chien de compagnie, nous entraînons notre animal à nous apporter une balle. Nous lançons la balle à une certaine distance et demandons au chien de nous la rapporter. Chaque fois que le chien fait cela correctement, nous récompensons le chien. Lentement, le chien apprend que faire le travail correctement lui donne une récompense, puis le chien commence à faire le travail correctement à chaque fois à l'avenir. Exactement, ce concept est appliqué dans le type d'apprentissage «Renforcement». La technique a été initialement développée pour que les machines puissent jouer à des jeux. La machine reçoit un algorithme pour analyser tous les mouvements possibles à chaque étape du jeu. La machine peut sélectionner l'un des mouvements au hasard. Si le coup est juste, la machine est récompensée, sinon elle peut être pénalisée. Lentement, la machine commencera à faire la différence entre les bons et les mauvais mouvements et après plusieurs itérations, elle apprendrait à résoudre le puzzle du jeu avec une meilleure précision. La précision de gagner le jeu s'améliorerait à mesure que la machine joue de plus en plus de jeux.

L'ensemble du processus peut être représenté dans le diagramme suivant -

Cette technique d'apprentissage automatique diffère de l'apprentissage supervisé en ce que vous n'avez pas besoin de fournir les paires d'entrée / sortie étiquetées. L'accent est mis sur la recherche d'un équilibre entre l'exploration des nouvelles solutions et l'exploitation des solutions apprises.

L'apprentissage en profondeur

Le deep learning est un modèle basé sur les réseaux de neurones artificiels (ANN), plus spécifiquement les réseaux de neurones convolutifs (CNN). Il existe plusieurs architectures utilisées dans l'apprentissage profond, telles que les réseaux de neurones profonds, les réseaux de croyances profondes, les réseaux de neurones récurrents et les réseaux de neurones convolutifs.

Ces réseaux ont été appliqués avec succès pour résoudre les problèmes de vision par ordinateur, de reconnaissance vocale, de traitement du langage naturel, de bioinformatique, de conception de médicaments, d'analyse d'images médicales et de jeux. Il existe plusieurs autres domaines dans lesquels l'apprentissage en profondeur est appliqué de manière proactive. L'apprentissage en profondeur nécessite une puissance de traitement énorme et d'énormes données, qui sont généralement facilement disponibles de nos jours.

Nous parlerons plus en détail du deep learning dans les prochains chapitres.

Apprentissage par renforcement profond

Le Deep Reinforcement Learning (DRL) combine les techniques d'apprentissage approfondi et par renforcement. Les algorithmes d'apprentissage par renforcement comme le Q-learning sont désormais combinés avec l'apprentissage en profondeur pour créer un modèle DRL puissant. La technique rencontre un grand succès dans les domaines de la robotique, des jeux vidéo, de la finance et de la santé. De nombreux problèmes auparavant insolubles sont désormais résolus en créant des modèles DRL. Il y a beaucoup de recherches en cours dans ce domaine et cela est très activement poursuivi par les industries.

Jusqu'à présent, vous avez une brève introduction à divers modèles d'apprentissage automatique, explorons maintenant un peu plus en profondeur divers algorithmes disponibles sous ces modèles.