TIKA - API référencée

Les utilisateurs peuvent intégrer Tika dans leurs applications à l'aide de la classe de façade Tika. Il a des méthodes pour explorer toutes les fonctionnalités de Tika. Puisqu'il s'agit d'une classe de façade, Tika fait abstraction de la complexité derrière ses fonctions. En plus de cela, les utilisateurs peuvent également utiliser les différentes classes de Tika dans leurs applications.

Classe Tika (façade)

C'est la classe la plus importante de la bibliothèque Tika et suit le modèle de conception de la façade. Par conséquent, il fait abstraction de toutes les implémentations internes et fournit des méthodes simples pour accéder aux fonctionnalités de Tika. Le tableau suivant répertorie les constructeurs de cette classe avec leurs descriptions.

package - org.apache.tika

class - Tika

N ° Sr. Constructeur et description
1

Tika ()

Utilise la configuration par défaut et construit la classe Tika.

2

Tika (Detector detector)

Crée une façade Tika en acceptant l'instance du détecteur comme paramètre

3

Tika (Detector detector, Parser parser)

Crée une façade Tika en acceptant les instances de détecteur et d'analyseur comme paramètres.

4

Tika (Detector detector, Parser parser, Translator translator)

Crée une façade Tika en acceptant le détecteur, l'analyseur et l'instance du traducteur comme paramètres.

5

Tika (TikaConfig config)

Crée une façade Tika en acceptant l'objet de la classe TikaConfig comme paramètre.

Méthodes et description

Voici les méthodes importantes de la classe de façade Tika -

N ° Sr. Méthodes et description
1

analyserToString (File fichier)

Cette méthode et toutes ses variantes analyse le fichier passé en paramètre et renvoie le contenu du texte extrait au format String. Par défaut, la longueur de ce paramètre de chaîne est limitée.

2

int getMaxStringLength ()

Renvoie la longueur maximale des chaînes renvoyées par les méthodes parseToString.

3

néant setMaxStringLength (int maxStringLength)

Définit la longueur maximale des chaînes renvoyées par les méthodes parseToString.

4

Lecteur parse (File fichier)

Cette méthode et toutes ses variantes analyse le fichier passé en paramètre et retourne le contenu du texte extrait sous la forme de l'objet java.io.reader.

5

Chaîne detect (InputStream courant, Metadata métadonnées)

Cette méthode et toutes ses variantes acceptent un objet InputStream et un objet Metadata comme paramètres, détecte le type du document donné et renvoie le nom du type de document sous forme d'objet String. Cette méthode fait abstraction des mécanismes de détection utilisés par Tika.

6

Chaîne translate (InputStream texte, String langue cible)

Cette méthode et toutes ses variantes acceptent l'objet InputStream et une chaîne représentant la langue dans laquelle nous voulons que notre texte soit traduit, et traduit le texte donné dans la langue souhaitée, en essayant de détecter automatiquement la langue source.

Interface d'analyseur

C'est l'interface qui est implémentée par toutes les classes d'analyseurs du package Tika.

package - org.apache.tika.parser

Interface - Analyseur

Méthodes et description

Ce qui suit est la méthode importante de l'interface Tika Parser -

N ° Sr. Méthodes et description
1

parse (InputStream stream, ContentHandler handler, Metadata metadata, ParseContext context)

Cette méthode analyse le document donné en une séquence d'événements XHTML et SAX. Après l'analyse, il place le contenu du document extrait dans l'objet de la classe ContentHandler et les métadonnées dans l'objet de la classe Metadata.

Classe de métadonnées

Cette classe implémente diverses interfaces telles que CreativeCommons, Geographic, HttpHeaders, Message, MSOffice, ClimateForcast, TIFF, TikaMetadataKeys, TikaMimeKeys, Serializable pour prendre en charge divers modèles de données. Les tableaux suivants répertorient les constructeurs et les méthodes de cette classe avec leurs descriptions.

package - org.apache.tika.metadata

class - Métadonnées

N ° Sr. Constructeur et description
1

Metadata()

Construit une nouvelle métadonnée vide.

N ° Sr. Méthodes et description
1

add (Property property, String value)

Ajoute un mappage propriété / valeur de métadonnées à un document donné. En utilisant cette fonction, nous pouvons définir la valeur sur une propriété.

2

add (String name, String value)

Ajoute un mappage propriété / valeur de métadonnées à un document donné. En utilisant cette méthode, nous pouvons définir une nouvelle valeur de nom sur les métadonnées existantes d'un document.

3

String get (Property property)

Renvoie la valeur (le cas échéant) de la propriété de métadonnées donnée.

4

String get (String name)

Renvoie la valeur (le cas échéant) du nom de métadonnées donné.

5

Date getDate (Property property)

Renvoie la valeur de la propriété de métadonnées Date.

6

String[] getValues (Property property)

Renvoie toutes les valeurs d'une propriété de métadonnées.

sept

String[] getValues (String name)

Renvoie toutes les valeurs d'un nom de métadonnées donné.

8

String[] names()

Renvoie tous les noms des éléments de métadonnées dans un objet de métadonnées.

9

set (Property property, Date date)

Définit la valeur de date de la propriété de métadonnées donnée

dix

set(Property property, String[] values)

Définit plusieurs valeurs sur une propriété de métadonnées.

Classe d'identifiant de langue

Cette classe identifie la langue du contenu donné. Les tableaux suivants répertorient les constructeurs de cette classe avec leurs descriptions.

package - org.apache.tika.language

class - Identificateur de langue

N ° Sr. Constructeur et description
1

LanguageIdentifier (LanguageProfile profile)

Instancie l'identifiant de langue. Ici, vous devez passer un objet LanguageProfile comme paramètre.

2

LanguageIdentifier (String content)

Ce constructeur peut instancier un identificateur de langue en passant une chaîne à partir du contenu textuel.

N ° Sr. Méthodes et description
1

String getLanguage ()

Renvoie la langue donnée à l'objet LanguageIdentifier actuel.