Scikit Learn - Bayes naïves gaussiennes

Comme son nom l'indique, le classificateur Gaussian Naïve Bayes suppose que les données de chaque étiquette sont tirées d'une simple distribution gaussienne. Le Scikit-learn fournitsklearn.naive_bayes.GaussianNB pour implémenter l'algorithme Gaussian Naïve Bayes pour la classification.

Paramètres

Le tableau suivant contient les paramètres utilisés par sklearn.naive_bayes.GaussianNB méthode -

Sr. Non Paramètre et description
1

priors - forme de type arrray (n_classes)

Il représente les probabilités a priori des classes. Si nous spécifions ce paramètre lors de l'ajustement des données, les probabilités antérieures ne seront pas justifiées en fonction des données.

2

Var_smoothing - float, optionnel, par défaut = 1e-9

Ce paramètre donne la partie de la plus grande variance des caractéristiques qui est ajoutée à la variance afin de stabiliser le calcul.

Les attributs

Le tableau suivant comprend les attributs utilisés par sklearn.naive_bayes.GaussianNB méthode -

Sr. Non Attributs et description
1

class_prior_ - tableau, forme (n_classes,)

Il fournit la probabilité de chaque classe.

2

class_count_ - tableau, forme (n_classes,)

Il fournit le nombre réel d'échantillons d'apprentissage observés dans chaque classe.

3

theta_ - tableau, forme (n_classes, n_features)

Il donne la moyenne de chaque caractéristique par classe.

4

sigma_ - tableau, forme (n_classes, n_features)

Il donne la variance de chaque entité par classe.

5

epsilon_ - flotter

Il s'agit de la valeur additive absolue de la variance.

Méthodes

Le tableau suivant contient les méthodes utilisées par sklearn.naive_bayes.GaussianNB méthode -

Sr. Non Méthode et description
1

fit(soi, X, y [, poids_échantillon])

Cette méthode ajustera le classificateur Gaussian Naive Bayes selon X et y.

2

get_params(soi [, profond])

Avec l'aide de cette méthode, nous pouvons obtenir les paramètres de cet estimateur.

3

partial_fit(soi, X, y [, classes, poids_échantillon])

Cette méthode permet l'ajustement incrémentiel sur un lot d'échantillons.

4

predict(soi, X)

Cette méthode effectuera une classification sur un tableau de vecteurs de test X.

5

predict_log_proba(soi, X)

Cette méthode renverra les estimations de probabilité logarithmique pour le vecteur de test X.

6

predict_proba(soi, X)

Cette méthode retournera les estimations de probabilité pour le vecteur de test X.

sept

score(soi, X, y [, poids_échantillon])

Avec cette méthode, nous pouvons obtenir la précision moyenne sur les données de test et les étiquettes données.

9

set_params(self, \ * \ * paramètres)

Cette méthode nous permet de définir les paramètres de cet estimateur.

Exemple d'implémentation

Le script Python ci-dessous utilisera sklearn.naive_bayes.GaussianNB méthode pour construire le classificateur Gaussien Naïve Bayes à partir de notre ensemble de données -

Exemple

import numpy as np
X = np.array([[-1, -1], [-2, -4], [-4, -6], [1, 2]])
Y = np.array([1, 1, 2, 2])
from sklearn.naive_bayes import GaussianNB
GNBclf = GaussianNB()
GNBclf.fit(X, Y)

Production

GaussianNB(priors = None, var_smoothing = 1e-09)

Maintenant, une fois ajusté, nous pouvons prédire la nouvelle valeur en utilisant la méthode prédire () comme suit -

Exemple

print((GNBclf.predict([[-0.5, 2]]))

Production

[2]