Data preprocessing and visualization
Objectives
A definir.
General characterization
Code
100162
Credits
6.0
Responsible teacher
Pedro Miguel Pereira Simões Coelho
Hours
Weekly - Available soon
Total - Available soon
Teaching language
Portuguese. If there are Erasmus students, classes will be taught in English
Prerequisites
A definir.
Bibliography
- Sharma, S. (1996). Applied Multivariate Techniques. New York, John Wiley & Sons, Inc.;
- Garcia, Luengo and Herrera (2015). Data Preprocessing in Data Mining. Springer International Publishing;
- Batini and Scannapieco (2006). Data Quality: Concepts, Methodologies and Techniques. S pringer-Verlag Berlin Heidelberg;
- Rodrigues and Papakonstantinou (2018). Privacy and Data Protection Seals. T.M.C. Asser Press.;
- Graham, J. (2012). Missing Data: Analysis and Design. Springer-Verlag New York
Teaching method
A unidade curricular é baseada num misto entre aulas teóricas e práticas. Em cada aula serão introduzidos novos conceitos e metodologias, assim como serão aplicados os conceitos aprendidos através da realização de exercícios com diferentes softwares. Serão utilizadas diferentes estratégias de aprendizagem, nomeadamente, apresentação de slides, demonstrações e tutoriais. A componente mais prática é focada na utilização e exploração de diferentes softwares, incluindo também discussões com os alunos sobre diversos cenários.
Evaluation method
Avaliação Contínua:
Participação (10%)
1º Teste (20%)
Projeto de grupo (35%)
2º Teste (35%)
2º Época:
Projeto de grupo (35%)
Exame (65%)
Nota:
Teste, exame e o projeto de grupo tem uma nota mínima de oito valores em 20; O projeto de grupo tem exatamente 4 membros.
Subject matter
Capítulo 1 - Introdução a Data Mining
Capítulo 2 - Construir ABT
Capítulo 3. Combinar Datasets
Capítulo 4. Técnicas de Data Mining
Capítulo 5. Técnicas básicas de tratamento de dados
Capítulo 6. Lidar com valores omissos
Capítulo 7. Lidar com outliers e dados esparsos
Capítulo 8. Tópicos avançados em dados matching
Capítulo 9. Aspectos relacionados com o controlo de qualidade dos dados e privacidade
Capítulo 10. Visualização de dados