Big Data para Marketing

Objetivos

1. Apresentar os alunos ao conceito de Big Data
2. Familiarizando-os com as tecnologias mais usadas para lidar com uma grande quantidade de dados
3. Entender um programa escrito com a lógica Map-Reduce
4. Ser capaz de executar tarefas ETL em uma grande quantidade de dados
5. Armazenar e recuperar dados armazenados no sistema de arquivos do Hadoop
6. Executar consultas em um banco de dados não-SQL
7. Aplicar os conceitos aprendidos no campo do Marketing
8. Resolver um problema de negócios caracterizado por uma grande quantidade de dados

Caracterização geral

Código

200202

Créditos

7.5

Professor responsável

Docente a designar

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

  

Bibliografia

- White, T. (2012). Hadoop: The definitive guide. " O 'Reilly Media, Inc.".
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis." O'Reilly Media, Inc.".
- Leskovec, J., Rajaraman, A., & Ullman, J. D. (2014). Mining of massive datasets. Cambridge university press.
 

Método de ensino

  

Método de avaliação

  

Conteúdo

1. Introdução ao Big Data
2. Os cinco V do Big Data
3. O file system do Hadoop
4. Utilizar o Map-Reduce para escrever um programa Hadoop
5. A fase do map: como organizar os dados
6. A fase de reduce: técnicas para combinar dados com uma chave comum
7. ETL com Sqoop
8. Diferenças entre as linguagens SQL e não SQL
9. Executar uma consulta em uma grande quantidade de dados
10. Técnica para otimizar uma consulta num ambiente de produção
11. Aplicações das diferentes ferramentas para endereçar tarefas complexas