Apprentissage automatique pour l'analyse des données

L'apprentissage automatique est un sous-domaine de l'informatique qui traite de tâches telles que la reconnaissance de formes, la vision par ordinateur, la reconnaissance vocale, l'analyse de texte et a un lien étroit avec les statistiques et l'optimisation mathématique. Les applications comprennent le développement de moteurs de recherche, le filtrage des spams, la reconnaissance optique de caractères (OCR), entre autres. Les frontières entre l'exploration de données, la reconnaissance de formes et le domaine de l'apprentissage statistique ne sont pas claires et renvoient toutes à des problèmes similaires.

L'apprentissage automatique peut être divisé en deux types de tâches:

  • Enseignement supervisé
  • Apprentissage non supervisé

Enseignement supervisé

L'apprentissage supervisé fait référence à un type de problème où il y a une donnée d'entrée définie comme une matrice X et nous sommes intéressés à prédire une réponse y . Où X = {x 1 , x 2 ,…, x n } a n prédicteurs et a deux valeurs y = {c 1 , c 2 } .

Un exemple d'application serait de prédire la probabilité qu'un internaute clique sur des publicités en utilisant des caractéristiques démographiques comme prédicteurs. Ceci est souvent appelé pour prédire le taux de clics (CTR). Alors y = {clic, ne - clique pas} et les prédicteurs pourraient être l'adresse IP utilisée, le jour où il est entré sur le site, la ville de l'utilisateur, le pays parmi d'autres fonctionnalités qui pourraient être disponibles.

Apprentissage non supervisé

L'apprentissage non supervisé aborde le problème de trouver des groupes qui se ressemblent sans avoir une classe à partir de laquelle apprendre. Il existe plusieurs approches pour apprendre une cartographie à partir des prédicteurs pour trouver des groupes qui partagent des instances similaires dans chaque groupe et sont différents les uns des autres.

Un exemple d'application d'apprentissage non supervisé est la segmentation des clients. Par exemple, dans le secteur des télécommunications, une tâche courante consiste à segmenter les utilisateurs en fonction de l'utilisation qu'ils donnent au téléphone. Cela permettrait au service marketing de cibler chaque groupe avec un produit différent.