Préprocessamento de dados e visualização

Objetivos

A definir.

Caracterização geral

Código

100162

Créditos

6.0

Professor responsável

Pedro Miguel Pereira Simões Coelho

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

A definir.

Bibliografia

  1. Sharma, S. (1996). Applied Multivariate Techniques. New York, John Wiley & Sons, Inc.;
  2. Garcia, Luengo and Herrera (2015). Data Preprocessing in Data Mining. Springer International Publishing;
  3. Batini and Scannapieco (2006). Data Quality: Concepts, Methodologies and Techniques. S pringer-Verlag Berlin Heidelberg;
  4. Rodrigues and Papakonstantinou (2018). Privacy and Data Protection Seals. T.M.C. Asser Press.;
  5. Graham, J. (2012). Missing Data: Analysis and Design. Springer-Verlag New York

Método de ensino

A unidade curricular é baseada num misto entre aulas teóricas e práticas. Em cada aula serão introduzidos novos conceitos e metodologias, assim como serão aplicados os conceitos aprendidos através da realização de exercícios com diferentes softwares. Serão utilizadas diferentes estratégias de aprendizagem, nomeadamente, apresentação de slides, demonstrações e tutoriais. A componente mais prática é focada na utilização e exploração de diferentes softwares, incluindo também discussões com os alunos sobre diversos cenários.

 

Método de avaliação

Avaliação Contínua:

Participação (10%)

1º Teste (20%)

Projeto de grupo (35%)

2º Teste (35%)

 

2º Época:

Projeto de grupo (35%)

Exame (65%)

 

Nota:

Teste, exame e o projeto de grupo tem uma nota mínima de oito valores em 20; O projeto de grupo tem exatamente 4 membros.

Conteúdo

Capítulo 1 - Introdução a Data Mining

Capítulo 2 - Construir ABT

Capítulo 3. Combinar Datasets

Capítulo 4. Técnicas de Data Mining

Capítulo 5. Técnicas básicas de tratamento de dados

Capítulo 6. Lidar com valores omissos

Capítulo 7. Lidar com outliers e dados esparsos

Capítulo 8. Tópicos avançados em dados matching

Capítulo 9. Aspectos relacionados com o controlo de qualidade dos dados e privacidade

Capítulo 10. Visualização de dados

Cursos

Cursos onde a unidade curricular é leccionada: