Qual é a diferença entre NameNode e DataNode no Hadoop

Índice:

Anonim

o principal diferença entre NameNode e DataNode no Hadoop é que o NameNode é o nó mestre no Hadoop Distributed File System que gerencia os metadados do sistema de arquivos, enquanto o DataNode é um nó escravo no sistema de arquivos distribuído Hadoop que armazena os dados reais conforme instruído pelo NameNode.

Hadoop é uma estrutura de código aberto desenvolvida pela Apache Software Foundation. Ele permite armazenar e processar uma grande quantidade de dados simultaneamente em clusters de computadores em um ambiente distribuído. O HDFS, por outro lado, é o sistema de arquivos distribuído do Hadoop, que distribui dados em várias máquinas e os replica para aumentar a durabilidade, confiabilidade e disponibilidade. Além disso, o HDFS funciona de acordo com a arquitetura mestre-escravo. Namenode e dataNode são componentes desta arquitetura.

Principais áreas cobertas

1. O que é NameNode - Definição, Funcionalidade 2. O que é DataNode - Definição, Funcionalidade 3. Qual é a relação entre NameNode e DataNode - Esboço da Associação 4. Qual é a diferença entre NameNode e DataNode no Hadoop - Comparação das principais diferenças

Termos chave

DataNode, Hadoop, HDFS, NameNode

O que é NameNode

Metadados referem-se a uma pequena quantidade de dados e requerem uma quantidade mínima de memória para armazenamento. Namenode armazena esses metadados de todos os arquivos no HDFS. Os metadados incluem permissão de arquivo, nomes e localização de cada bloco. Um bloco é uma quantidade mínima de dados que podem ser lidos ou gravados. Além disso, NameNode mapeia esses blocos para dataNodes. Além disso, nameNode gerencia todos os outros dataNodes. Nó mestre é um nome alternativo para nameNode.

O que é DataNode

Os nós diferentes de nameNode são chamados de dataNodes. Nó escravo é outro nome para dataNode. Os nós de dados armazenam e recuperam blocos conforme instruído pelo nameNode.

Todos os dataNodes comunicam-se continuamente com o nó de nome. Eles também informam o nameNode sobre os blocos que estão armazenando. Além disso, os dataNodes também executam a criação, exclusão e replicação de blocos conforme as instruções do nameNode.

Relação entre NameNode e DataNode

Diferença entre NameNode e DataNode

Definição

NameNode é o controlador e gerenciador do HDFS, enquanto o DataNode é um nó diferente do NameNode no HDFS que é controlado pelo NameNode. Portanto, esta é a principal diferença entre NameNode e DataNode no Hadoop.

Sinônimos

Funcionalidade Principal

Enquanto nameNode lida com os metadados de todos os arquivos no HDFS e controla os dataNodes, o Datanode armazena e recupera blocos de acordo com as instruções do nó mestre. Portanto, esta é outra diferença entre NameNode e DataNode no Hadoop.

Conclusão

A principal diferença entre NameNode e DataNode no Hadoop é que o NameNode é o nó mestre no HDFS que gerencia os metadados do sistema de arquivos, enquanto o DataNode é um nó escravo no HDFS que armazena os dados reais conforme instruído pelo NameNode. Em resumo, NameNode controla e gerencia um ou vários nós de dados.

Referência:

1. “HDFS - Javatpoint.” Www.javatpoint.com, disponível aqui.

Cortesia de imagem:

1. “Hdfsarchitecture” de Magnai17 - Trabalho do próprio (CC BY-SA 4.0) via Commons Wikimedia

Qual é a diferença entre NameNode e DataNode no Hadoop