Apache Flink - Flink vs Spark vs Hadoop

Voici un tableau complet, qui montre la comparaison entre les trois frameworks Big Data les plus populaires: Apache Flink, Apache Spark et Apache Hadoop.

Apache Hadoop Apache Spark Apache Flink

Year of Origin

2005 2009 2009

Place of Origin

MapReduce (Google) Hadoop (Yahoo) Université de Californie, Berkeley Université technique de Berlin

Data Processing Engine

Lot Lot Courant

Processing Speed

Plus lent que Spark et Flink 100x plus rapide que Hadoop Plus rapide qu'une étincelle

Programming Languages

Java, C, C ++, Ruby, Groovy, Perl, Python Java, Scala, python et R Java et Scala

Programming Model

MapReduce Ensembles de données distribués résilients (RDD) Flux de données cycliques

Data Transfer

Lot Lot Pipeline et lot

Memory Management

Basé sur le disque Géré par JVM Géré actif

Latency

Faible Moyen Faible

Throughput

Moyen Haute Haute

Optimization

Manuel Manuel Automatique

API

Niveau faible Haut niveau Haut niveau

Streaming Support

N / A Spark Streaming Flink Streaming

SQL Support

Ruche, Impala SparkSQL API de table et SQL

Graph Support

N / A GraphX Gelly

Machine Learning Support

N / A SparkML FlinkML