Boîte à outils en langage naturel - Premiers pas

Pour installer NLTK, nous devons avoir Python installé sur nos ordinateurs. Vous pouvez aller sur le lien www.python.org/downloads et sélectionner la dernière version pour votre système d'exploitation, à savoir Windows, Mac et Linux / Unix. Pour un tutoriel de base sur Python, vous pouvez vous référer au lien .

Maintenant, une fois que Python est installé sur votre système informatique, laissez-nous comprendre comment nous pouvons installer NLTK.

Installation de NLTK

Nous pouvons installer NLTK sur divers OS comme suit -

Sous Windows

Pour installer NLTK sur le système d'exploitation Windows, suivez les étapes ci-dessous -

  • Tout d'abord, ouvrez l'invite de commande Windows et accédez à l'emplacement du pip dossier.

  • Ensuite, entrez la commande suivante pour installer NLTK -

pip3 install nltk

Maintenant, ouvrez le PythonShell à partir du menu Démarrer de Windows et tapez la commande suivante afin de vérifier l'installation de NLTK -

Import nltk

Si vous n'obtenez aucune erreur, vous avez correctement installé NLTK sur votre système d'exploitation Windows avec Python3.

Sur Mac / Linux

Pour installer NLTK sur Mac / Linux OS, écrivez la commande suivante -

sudo pip install -U nltk

Si vous n'avez pas installé pip sur votre ordinateur, suivez les instructions ci-dessous pour la première installation pip -

Tout d'abord, mettez à jour l'index du package en suivant la commande suivante -

sudo apt update

Maintenant, tapez la commande suivante pour installer pip pour python 3 -

sudo apt install python3-pip

Par Anaconda

Pour installer NLTK via Anaconda, suivez les étapes ci-dessous -

Tout d'abord, pour installer Anaconda, allez sur le lien www.anaconda.com/distribution/#download-section puis sélectionnez la version de Python que vous devez installer.

Une fois que vous avez Anaconda sur votre système informatique, accédez à son invite de commande et écrivez la commande suivante -

conda install -c anaconda nltk

Vous devez examiner la sortie et saisir «oui». NLTK sera téléchargé et installé dans votre package Anaconda.

Téléchargement de l'ensemble de données et des packages de NLTK

Nous avons maintenant NLTK installé sur nos ordinateurs, mais pour l'utiliser, nous devons télécharger les ensembles de données (corpus) disponibles. Certains des ensembles de données importants disponibles sontstpwords, guntenberg, framenet_v15 etc.

À l'aide des commandes suivantes, nous pouvons télécharger tous les ensembles de données NLTK -

import nltk
nltk.download()

Vous obtiendrez la fenêtre de téléchargement NLTK suivante.

Maintenant, cliquez sur le bouton de téléchargement pour télécharger les ensembles de données.

Comment exécuter le script NLTK?

Voici l'exemple dans lequel nous implémentons l'algorithme de Porter Stemmer en utilisant PorterStemmerclasse nltk. avec cet exemple, vous seriez en mesure de comprendre comment exécuter le script NLTK.

Tout d'abord, nous devons importer la boîte à outils en langage naturel (nltk).

import nltk

Maintenant, importez le PorterStemmer classe pour implémenter l'algorithme Porter Stemmer.

from nltk.stem import PorterStemmer

Ensuite, créez une instance de la classe Porter Stemmer comme suit -

word_stemmer = PorterStemmer()

Maintenant, saisissez le mot que vous souhaitez extraire. -

word_stemmer.stem('writing')

Production

'write'
word_stemmer.stem('eating')

Production

'eat'