Utilizo esse repositório para o desafio de criar um ecossistema Hadoop, totalmente gerenciado pelo GC Dataproc.
Acrescentei um script que cria automaticamente um arquivo 'resultado.txt' com as 10 palavras mais repetidas ( No caso, 10 primeiros, pois o arquivo já estava em ordem).
agradeço aos instrutores, o compartilhamento do conhecimento, pois já estou conseguindo rodar scripts no meu cluster, para analisar ativos financeiros.