Análise de Grandes Volumes de Dados

Objetivos

A definir.

Caracterização geral

Código

100172

Créditos

6.0

Professor responsável

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

A definir.

Bibliografia

- White, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 2012;

- Karau, Holden, et al. Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.", 2015
- White, Tom. Hadoop: The definitive guide. " O'Reilly Media, Inc.", 2012;

- Capriolo, Edward, Dean Wampler, and Jason Rutherglen. Programming Hive: Data warehouse and query language for Hadoop. " O'Reilly Media, Inc.", 2012;

- Tutorials and other materials provided by the Teaching staff

Método de ensino

A unidade curricular baseia-se em aulas teórico-práticas.  As sessões incluem a exposição de conceitos e metodologias, bem como a aplicação prática dos diferentes conceitos utilizando diferentes soluções computacionais, tais como Hadoop e Spark. São aplicadas diversas estratégias de ensino, incluindo palestras, apresentação de slides, instruções passo-a-passo de como abordar exemplos práticos, perguntas e respostas. A componente prática está orientada para a exploração das ferramentas introduzidas aos estudantes, incluindo a discussão da melhor abordagem em diferentes cenários, e a resolução de exercícios.

Método de avaliação

Elementos de Avaliação:

EA1 Participação nas atividades da sala de aula (15%)

EA2 Projeto prático (35%)

EA3 Desafio Prático (50%).

Conteúdo

A unidade está organizada em quatro Unidades de Aprendizagem (UA):

UA1 - Desafios no processamento Big Data

UA2 - Modelo Map-Reduce

UA3 - Ecossistema Hadoop

UA4 - Processamento de dados em Spark

Cursos

Cursos onde a unidade curricular é leccionada: