Apache Presto - Outils d'administration

Dans ce chapitre, nous aborderons les outils d'administration utilisés dans Presto. Commençons par l'interface Web de Presto.

Interface Web

Presto fournit une interface Web pour surveiller et gérer les requêtes. Il est accessible à partir du numéro de port spécifié dans les propriétés de configuration du coordinateur.

Démarrez le serveur Presto et la CLI Presto. Ensuite, vous pouvez accéder à l'interface Web à partir de l'url suivante -http://localhost:8080/

La sortie sera similaire à l'écran ci-dessus.

Ici, la page principale contient une liste de requêtes ainsi que des informations telles que l'ID de requête unique, le texte de la requête, l'état de la requête, le pourcentage terminé, le nom d'utilisateur et la source à partir de laquelle cette requête est issue. Les dernières requêtes s'exécutent en premier, puis les requêtes terminées ou non terminées sont affichées en bas.

Réglage des performances sur Presto

Si le cluster Presto rencontre des problèmes de performances, modifiez vos paramètres de configuration par défaut pour les paramètres suivants.

Propriétés de configuration

  • task. info -refresh-max-wait - Réduit la charge de travail du coordinateur.

  • task.max-worker-threads - Divise le processus et affecte à chaque nœud de travail.

  • distributed-joins-enabled - Jointures distribuées basées sur le hachage.

  • node-scheduler.network-topology - Définit la topologie du réseau sur le planificateur.

Paramètres JVM

Modifiez vos paramètres JVM par défaut pour les paramètres suivants. Cela sera utile pour diagnostiquer les problèmes de garbage collection.

-XX:+PrintGCApplicationConcurrentTime 
-XX:+PrintGCApplicationStoppedTime 
-XX:+PrintGCCause 
-XX:+PrintGCDateStamps 
-XX:+PrintGCTimeStamps 
-XX:+PrintGCDetails 
-XX:+PrintReferenceGC 
-XX:+PrintClassHistogramAfterFullGC 
-XX:+PrintClassHistogramBeforeFullGC 
-XX:PrintFLSStatistics = 2 
-XX:+PrintAdaptiveSizePolicy 
-XX:+PrintSafepointStatistics 
-XX:PrintSafepointStatisticsCount = 1