Lucene - StopAnalyzer

Cet analyseur fonctionne de la même manière que SimpleAnalyzer et supprime les mots courants tels que «a», «an», «the», etc.

Déclaration de classe

Voici la déclaration pour le org.apache.lucene.analysis.StopAnalyzer classe -

public final class StopAnalyzer
   extends StopwordAnalyzerBase

Des champs

Voici les champs de la classe org.apache.lucene.analysis.StopAnalyzer -

  • static Set<?> ENGLISH_STOP_WORDS_SET - Un ensemble non modifiable contenant des mots anglais courants qui ne sont généralement pas utiles pour la recherche.

Constructeurs de classe

Le tableau suivant montre les différents constructeurs de classe -

S.No. Constructeur et description
1

StopAnalyzer(Version matchVersion)

Construit un analyseur qui supprime les mots dans ENGLISH_STOP_WORDS_SET.

2

StopAnalyzer(Version matchVersion, File stopwordsFile)

Construit un analyseur avec les mots vides du fichier donné.

3

StopAnalyzer(Version matchVersion, Reader stopwords)

Construit un analyseur avec les mots vides du lecteur donné.

4

StopAnalyzer(Version matchVersion, Set<?> stopWords)

Construit un analyseur avec les mots vides de l'ensemble donné.

Méthodes de classe

Le tableau suivant montre les différentes méthodes de classe -

S.No. Méthode et description
1

protected Reusable Analyzer Base. Token Stream Components create Components (String field Name, Reader reader)

Crée un nouveau ReusableAnalyzerBase.TokenStreamComponents utilisé pour tokeniser tout le texte dans le Reader fourni.

Méthodes héritées

Cette classe hérite des méthodes des classes suivantes -

  • org.apache.lucene.analysis.StopwordAnalyzerBase
  • org.apache.lucene.analysis.ReusableAnalyzerBase
  • org.apache.lucene.analysis.Analyzer
  • java.lang.Object

Usage

private void displayTokenUsingStopAnalyzer() throws IOException {
   String text 
      = "Lucene is simple yet powerful java based search library.";
   Analyzer analyzer = new StopAnalyzer(Version.LUCENE_36);
   TokenStream tokenStream 
      = analyzer.tokenStream(LuceneConstants.CONTENTS, 
      new StringReader(text));
   TermAttribute term = tokenStream.addAttribute(TermAttribute.class);
   while(tokenStream.incrementToken()) {
      System.out.print("[" + term.term() + "] ");
   }
}

Exemple d'application

Créons une application de test Lucene pour tester la recherche à l'aide de BooleanQuery.

Étape La description
1 Créez un projet avec un nom LuceneFirstApplication sous un package com.tutorialspoint.lucene comme expliqué dans le chapitre Lucene - Première application . Vous pouvez également utiliser le projet créé dans le chapitre Lucene - Première application en tant que tel pour ce chapitre pour comprendre le processus de recherche.
2 Créez LuceneConstants.java comme expliqué dans le chapitre Lucene - Première application . Gardez le reste des fichiers inchangés.
3 Créez LuceneTester.java comme indiqué ci-dessous.
4 Nettoyez et créez l'application pour vous assurer que la logique métier fonctionne conformément aux exigences.

LuceneConstants.java

Cette classe est utilisée pour fournir diverses constantes à utiliser dans l'exemple d'application.

package com.tutorialspoint.lucene;

public class LuceneConstants {
   public static final String CONTENTS = "contents";
   public static final String FILE_NAME = "filename";
   public static final String FILE_PATH = "filepath";
   public static final int MAX_SEARCH = 10;
}

LuceneTester.java

Cette classe est utilisée pour tester la capacité de recherche de la bibliothèque Lucene.

package com.tutorialspoint.lucene;

import java.io.IOException;
import java.io.StringReader;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.StopAnalyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.analysis.tokenattributes.TermAttribute;
import org.apache.lucene.util.Version;

public class LuceneTester {
	
   public static void main(String[] args) {
      LuceneTester tester;

      tester = new LuceneTester();
   
      try {
         tester.displayTokenUsingStopAnalyzer();
      } catch (IOException e) {
         e.printStackTrace();
      }
   }

   private void displayTokenUsingStopAnalyzer() throws IOException {
      String text 
         = "Lucene is simple yet powerful java based search library.";
      Analyzer analyzer = new StopAnalyzer(Version.LUCENE_36);
      TokenStream tokenStream = analyzer.tokenStream(
         LuceneConstants.CONTENTS, new StringReader(text));
      TermAttribute term = tokenStream.addAttribute(TermAttribute.class);
      while(tokenStream.incrementToken()) {
         System.out.print("[" + term.term() + "] ");
      }
   }
}

Exécution du programme

Une fois que vous avez terminé la création de la source, vous pouvez continuer en compilant et en exécutant votre programme. Pour ce faire, gardez leLuceneTester.Java onglet fichier actif et utilisez soit l'option Exécuter disponible dans l'EDI Eclipse, soit utilisez Ctrl + F11 pour compiler et exécuter votre LuceneTesterapplication. Si votre application s'exécute avec succès, elle imprimera le message suivant dans la console d'Eclipse IDE -

[lucene] [simple] [yet] [powerful] [java] [based] [search] [library]