Data preprocessing and visualization

Objectives

A definir.

General characterization

Code

100162

Credits

6.0

Responsible teacher

Pedro Miguel Pereira Simões Coelho

Hours

Weekly - Available soon

Total - Available soon

Teaching language

Portuguese. If there are Erasmus students, classes will be taught in English

Prerequisites

A definir.

Bibliography

  1. Sharma, S. (1996). Applied Multivariate Techniques. New York, John Wiley & Sons, Inc.;
  2. Garcia, Luengo and Herrera (2015). Data Preprocessing in Data Mining. Springer International Publishing;
  3. Batini and Scannapieco (2006). Data Quality: Concepts, Methodologies and Techniques. S pringer-Verlag Berlin Heidelberg;
  4. Rodrigues and Papakonstantinou (2018). Privacy and Data Protection Seals. T.M.C. Asser Press.;
  5. Graham, J. (2012). Missing Data: Analysis and Design. Springer-Verlag New York

Teaching method

A unidade curricular é baseada num misto entre aulas teóricas e práticas. Em cada aula serão introduzidos novos conceitos e metodologias, assim como serão aplicados os conceitos aprendidos através da realização de exercícios com diferentes softwares. Serão utilizadas diferentes estratégias de aprendizagem, nomeadamente, apresentação de slides, demonstrações e tutoriais. A componente mais prática é focada na utilização e exploração de diferentes softwares, incluindo também discussões com os alunos sobre diversos cenários.

 

Evaluation method

Avaliação Contínua:

Participação (10%)

1º Teste (20%)

Projeto de grupo (35%)

2º Teste (35%)

 

2º Época:

Projeto de grupo (35%)

Exame (65%)

 

Nota:

Teste, exame e o projeto de grupo tem uma nota mínima de oito valores em 20; O projeto de grupo tem exatamente 4 membros.

Subject matter

Capítulo 1 - Introdução a Data Mining

Capítulo 2 - Construir ABT

Capítulo 3. Combinar Datasets

Capítulo 4. Técnicas de Data Mining

Capítulo 5. Técnicas básicas de tratamento de dados

Capítulo 6. Lidar com valores omissos

Capítulo 7. Lidar com outliers e dados esparsos

Capítulo 8. Tópicos avançados em dados matching

Capítulo 9. Aspectos relacionados com o controlo de qualidade dos dados e privacidade

Capítulo 10. Visualização de dados

Programs

Programs where the course is taught: