TensorFlow - Calcul distribué

Ce chapitre se concentrera sur la façon de démarrer avec TensorFlow distribué. L'objectif est d'aider les développeurs à comprendre les concepts de base de TF distribués qui se reproduisent, tels que les serveurs TF. Nous utiliserons Jupyter Notebook pour évaluer le TensorFlow distribué. La mise en œuvre de l'informatique distribuée avec TensorFlow est mentionnée ci-dessous -

Step 1 - Importer les modules nécessaires obligatoires pour le calcul distribué -

import tensorflow as tf

Step 2- Créez un cluster TensorFlow avec un nœud. Laissez ce nœud être responsable d'un travail qui porte le nom «worker» et qui exécutera une prise sur localhost: 2222.

cluster_spec = tf.train.ClusterSpec({'worker' : ['localhost:2222']})
server = tf.train.Server(cluster_spec)
server.target

Les scripts ci-dessus génèrent la sortie suivante -

'grpc://localhost:2222'
The server is currently running.

Step 3 - La configuration du serveur avec la session respective peut être calculée en exécutant la commande suivante -

server.server_def

La commande ci-dessus génère la sortie suivante -

cluster {
   job {
      name: "worker"
      tasks {
         value: "localhost:2222"
      }
   }
}
job_name: "worker"
protocol: "grpc"

Step 4- Lancez une session TensorFlow avec le moteur d'exécution étant le serveur. Utilisez TensorFlow pour créer un serveur local et utiliserlsof pour connaître l'emplacement du serveur.

sess = tf.Session(target = server.target)
server = tf.train.Server.create_local_server()

Step 5 - Afficher les appareils disponibles dans cette session et fermer la session respective.

devices = sess.list_devices()
for d in devices:
   print(d.name)
sess.close()

La commande ci-dessus génère la sortie suivante -

/job:worker/replica:0/task:0/device:CPU:0