Hadoop, MongoDB: em quais situações um é mais adequado que o outro?

Tenho ouvido falar, ultimamente, muito sobre Hadoop e MongoDB: em que situações um é mais adequado de se utilizar do que o outro?

Não conheço muito, mas sei que são ferramentas distintas para casos distintos.

O MongoDB é um banco de dados não relacional orientado a documentos. Os registros são armazenados num formato chamado BSON, muito parecido com o JSON. Já o Hadoop é um framework de computação distribuída que usa processamento paralelo para analizar grandes quantidades de dados, sejam eles categorizados ou não.

[quote=Vina]Não conheço muito, mas sei que são ferramentas distintas para casos distintos.

O MongoDB é um banco de dados não relacional orientado a documentos. Os registros são armazenados num formato chamado BSON, muito parecido com o JSON. Já o Hadoop é um framework de computação distribuída que usa processamento paralelo para analizar grandes quantidades de dados, sejam eles categorizados ou não.[/quote]

É isso mesmo. Se for para haver uma comparação seria com o HBase que usa a infraestrutura do Hadoop, principalmente o HDFS.

Uma diferença principal está na alta escalabilidade horizontal que o HBase herda da infraestrutura Hadoop, colocar sua base espalhada em dezenas ou centenas de máquinas é algo natural. E o modelo de dados do HBase é baseado em colunas amplas, algo como cada linha pode conter um número enorme de colunas e as quais não precisam existir em todas as linhas. :slight_smile:

E claro, construir e manter uma infraestrutura Hadoop/HBase é bem mais trabalhoso que com o MongoDB, dado que com o HBase você terá um banco de dados de natureza distribuída, indo de algumas instâncias a centenas.

Espero que te ajude a esclarecer, mas sugiro investigar mais.

Abraço!