Análise de Grandes Volumes de Dados
Objetivos
A definir.
Caracterização geral
Código
100172
Créditos
6.0
Professor responsável
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Pré-requisitos
A definir.
Bibliografia
- White, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 2012;
- Karau, Holden, et al. Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.", 2015
- White, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 2012;
- Capriolo, Edward, Dean Wampler, and Jason Rutherglen. Programming Hive: Data warehouse and query language for Hadoop. " O'Reilly Media, Inc.", 2012;
- Tutorials and other materials provided by the Teaching staff
Método de ensino
A unidade curricular baseia-se em aulas teórico-práticas. As sessões incluem a exposição de conceitos e metodologias, bem como a aplicação prática dos diferentes conceitos utilizando diferentes soluções computacionais, tais como Hadoop e Spark. São aplicadas diversas estratégias de ensino, incluindo palestras, apresentação de slides, instruções passo-a-passo de como abordar exemplos práticos, perguntas e respostas. A componente prática está orientada para a exploração das ferramentas introduzidas aos estudantes, incluindo a discussão da melhor abordagem em diferentes cenários, e a resolução de exercícios.
Método de avaliação
Elementos de Avaliação:
EA1 Participação nas atividades da sala de aula (15%)
EA2 Projeto prático (35%)
EA3 Desafio Prático (50%).
Conteúdo
A unidade está organizada em quatro Unidades de Aprendizagem (UA):
UA1 - Desafios no processamento Big Data
UA2 - Modelo Map-Reduce
UA3 - Ecossistema Hadoop
UA4 - Processamento de dados em Spark