Régression logistique en Python - Limitations

Comme vous l'avez vu dans l'exemple ci-dessus, l'application de la régression logistique pour l'apprentissage automatique n'est pas une tâche difficile. Cependant, il a ses propres limites. La régression logistique ne pourra pas gérer un grand nombre de caractéristiques catégorielles. Dans l'exemple dont nous avons discuté jusqu'à présent, nous avons réduit le nombre de fonctionnalités dans une très large mesure.

Cependant, si ces caractéristiques étaient importantes dans notre prédiction, nous aurions été obligés de les inclure, mais alors la régression logistique ne nous donnerait pas une bonne précision. La régression logistique est également vulnérable au surajustement. Il ne peut pas être appliqué à un problème non linéaire. Il fonctionnera mal avec des variables indépendantes qui ne sont pas corrélées à la cible et sont corrélées les unes aux autres. Ainsi, vous devrez évaluer soigneusement l'adéquation de la régression logistique au problème que vous essayez de résoudre.

Il existe de nombreux domaines de l'apprentissage automatique dans lesquels d'autres techniques sont spécifiées. Pour n'en nommer que quelques-uns, nous avons des algorithmes tels que les k-plus proches voisins (kNN), la régression linéaire, les machines vectorielles de support (SVM), les arbres de décision, les bayes naïves, etc. Avant de finaliser sur un modèle particulier, vous devrez évaluer l'applicabilité de ces différentes techniques au problème que nous essayons de résoudre.