Tenho ouvido falar, ultimamente, muito sobre Hadoop e MongoDB: em que situações um é mais adequado de se utilizar do que o outro?
Não conheço muito, mas sei que são ferramentas distintas para casos distintos.
O MongoDB é um banco de dados não relacional orientado a documentos. Os registros são armazenados num formato chamado BSON, muito parecido com o JSON. Já o Hadoop é um framework de computação distribuída que usa processamento paralelo para analizar grandes quantidades de dados, sejam eles categorizados ou não.
[quote=Vina]Não conheço muito, mas sei que são ferramentas distintas para casos distintos.
O MongoDB é um banco de dados não relacional orientado a documentos. Os registros são armazenados num formato chamado BSON, muito parecido com o JSON. Já o Hadoop é um framework de computação distribuída que usa processamento paralelo para analizar grandes quantidades de dados, sejam eles categorizados ou não.[/quote]
É isso mesmo. Se for para haver uma comparação seria com o HBase que usa a infraestrutura do Hadoop, principalmente o HDFS.
Uma diferença principal está na alta escalabilidade horizontal que o HBase herda da infraestrutura Hadoop, colocar sua base espalhada em dezenas ou centenas de máquinas é algo natural. E o modelo de dados do HBase é baseado em colunas amplas, algo como cada linha pode conter um número enorme de colunas e as quais não precisam existir em todas as linhas.
E claro, construir e manter uma infraestrutura Hadoop/HBase é bem mais trabalhoso que com o MongoDB, dado que com o HBase você terá um banco de dados de natureza distribuída, indo de algumas instâncias a centenas.
Espero que te ajude a esclarecer, mas sugiro investigar mais.
Abraço!