Big Blog Analysis: Map Reduce and Sharding with MongoDB

Henrique Dias, IT Analyst, Federal University of Rio Grande do Sul

July 13 2012

Slides

A mineração de dados sobre blogs é uma tarefa difícil devido ao seu grande volume da dados. O MongoDB é uma ótima solução para distribuir os dados em shards, dentro de um cluster de computadores, e analisar as informações com tarefas MapReduce sobre 30 milhões de postagens coletadas de usuários Brasileiros.