7 de jan de 2019

[Parte 0 - 12] Engenharia de Dados com Hadoop e Spark - Instalando o Ecossistema Hadoop

Introdução 


Olá meu caro,

neste post iniciaremos a parte 0 de 12 posts que irão compor todo o processo de instalação e configuração de um Ecossistema Hadoop. O intuito é levar o aprendizado para mais perto das pessoas que o buscam.  E ao final podemos apreciar e utilizar o nosso ambiente para armazenar dados, fazer conectividade ETL etc...  


É comum a tarefa de provisionamento do Ecossistema Hadoop ficar a parte do Engenheiro de Dados, o cientista de dados normalmente já usufrui da infraestrutura de TI pronta. Para pessoas leigas no assunto eu irei deixar alguns artigos e posts no final deste como leitura recomendada. 

Todos os posts seguintes terão o título enumerado para facilitar a identificação e sequência.
  


Organização sumário e estrutura 


Para melhor organização iremos utilizar as funcionalidades gratuitas do Trello. O Trello é um aplicativo de gerenciamento de projeto baseado na web. Criei o quadro abaixo na ferramenta, o mesmo está compartilhado com em modo público, ou seja, todos podem acessa-ló para visualizar e acompanhar. A data de entrega não foi definida nas tarefas. São muitas etapas, não é simples montar um ambiente Hadoop! conto com a sua atenção, força de vontade e foco nos estudos, vamos juntos concluir todas as etapas deste projeto. ;) 


 engenharia-de-dados-com-hadoop-e-spark
Imagem1 - Projeto engenharia-de-dados-com-hadoop-e-spark



Para não se perder entre as etapas provisionei uma página onde irei colocar o link de todas as etapas assim que concluídas. Clique aqui para ir para a página.

Trello

Organize anything, together. Trello is a collaboration tool that organizes your projects into boards. In one glance, know what's being worked on, who's working on what, and where something is in a process.

Ao som de





E é isso, até o próximo :) ... 




Leitura recomendada



Nenhum comentário:

Postar um comentário