Lucene - Analyseur

La classe Analyzer est chargée d'analyser un document et d'obtenir les jetons / mots du texte qui doit être indexé. Sans analyse =, IndexWriter ne peut pas créer d'index.

Déclaration de classe

Voici la déclaration pour le org.apache.lucene.analysis.Analyzer classe -

public abstract class Analyzer
   extends Object
      implements Closeable

Constructeurs de classe

Le tableau suivant montre un constructeur de classe -

S.No. Constructeur et description
1

protected Analyzer()

Méthodes de classe

Le tableau suivant montre les différentes méthodes de classe -

S.No. Méthode et description
1

void close()

Libère les ressources persistantes utilisées par l'analyseur.

2

int getOffsetGap(Fieldable field)

Ceci est similaire à getPositionIncrementGap (java.lang.String), sauf pour les décalages de jetons.

3

int getPositionIncrementGap(String fieldName)

Ceci est appelé avant l'indexation d'un Fieldable exemple si des termes ont déjà été ajoutés à ce champ.

4

protected Object getPreviousTokenStream()

Utilisé par les analyseurs qui implémentent TokenStream réutilisable pour récupérer des TokenStreams précédemment enregistrés pour une réutilisation par le même thread.

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

Crée un TokenStream qui peut être réutilisé à partir de la dernière fois que le même thread a appelé cette méthode.

6

protected void setPreviousTokenStream(Object obj)

Utilisé par les analyseurs qui implémentent reusableTokenStream pour enregistrer un TokenStream pour une réutilisation ultérieure par le même thread.

sept

abstract TokenStream tokenStream(String fieldName, Reader reader)

Crée un TokenStream qui tokenise tout le texte du Reader fourni.

Méthodes héritées

Cette classe hérite des méthodes des classes suivantes -

  • java.lang.Object

Cet analyseur divise le texte dans un document en fonction de l'espace blanc.