Qu’est-ce que le cluster dans le Big Data ?

Qu’est-ce que le cluster dans le Big Data ?

Qu'est-ce que le cluster dans le Big Data ? Un cluster Hadoop est un type spécial de cluster de calcul conçu spécifiquement pour stocker et analyser

Coronavirus au Maroc : quel rôle de l’intelligence artificielle ?
Pour affronter Coronavirus … les étudiants de l’Ecole Supérieure de Technologie de Salé-UM5 proposent des solutions innovantes.
Comment détecter les objets sur les images RGB

Qu’est-ce que le cluster dans le Big Data ?

Un cluster Hadoop est un type spécial de cluster de calcul conçu spécifiquement pour stocker et analyser d’énormes quantités de données non structurées dans un environnement informatique distribué.

big data cluster

Ces clusters exécutent le logiciel de traitement distribué open source de Hadoop sur des ordinateurs de base à faible coût. En règle générale, une machine du cluster est désignée comme NameNode et une autre machine comme JobTracker; ce sont les maîtres. Les autres machines du cluster agissent à la fois comme DataNode et TaskTracker; ce sont les esclaves. Les clusters Hadoop sont souvent appelés systèmes «rien partagé» car c’est la seule chose partagée entre les nœuds du réseau qui les relie.

Les clusters Hadoop sont connus pour augmenter la vitesse des applications d’analyse de données. Ils sont également hautement évolutifs: si la puissance de traitement d’un cluster est dépassée par l’augmentation des volumes de données, des nœuds de cluster supplémentaires peuvent être ajoutés pour augmenter le débit. Les clusters Hadoop sont également très résistants aux pannes car chaque élément de données est copié sur d’autres nœuds de cluster, ce qui garantit que les données ne sont pas perdues en cas de défaillance d’un nœud.

Début 2013, Facebook était reconnu comme ayant le plus grand cluster Hadoop au monde. Parmi les autres utilisateurs éminents, citons Google, Yahoo et IBM.

COMMENTS