Préprocessamento de dados e visualização
Objetivos
A definir.
Caracterização geral
Código
100162
Créditos
6.0
Professor responsável
Pedro Miguel Pereira Simões Coelho
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Pré-requisitos
A definir.
Bibliografia
- Sharma, S. (1996). Applied Multivariate Techniques. New York, John Wiley & Sons, Inc.;
- Garcia, Luengo and Herrera (2015). Data Preprocessing in Data Mining. Springer International Publishing;
- Batini and Scannapieco (2006). Data Quality: Concepts, Methodologies and Techniques. S pringer-Verlag Berlin Heidelberg;
- Rodrigues and Papakonstantinou (2018). Privacy and Data Protection Seals. T.M.C. Asser Press.;
- Graham, J. (2012). Missing Data: Analysis and Design. Springer-Verlag New York
Método de ensino
A unidade curricular é baseada num misto entre aulas teóricas e práticas. Em cada aula serão introduzidos novos conceitos e metodologias, assim como serão aplicados os conceitos aprendidos através da realização de exercícios com diferentes softwares. Serão utilizadas diferentes estratégias de aprendizagem, nomeadamente, apresentação de slides, demonstrações e tutoriais. A componente mais prática é focada na utilização e exploração de diferentes softwares, incluindo também discussões com os alunos sobre diversos cenários.
Método de avaliação
Avaliação Contínua:
Participação (10%)
1º Teste (20%)
Projeto de grupo (35%)
2º Teste (35%)
2º Época:
Projeto de grupo (35%)
Exame (65%)
Nota:
Teste, exame e o projeto de grupo tem uma nota mínima de oito valores em 20; O projeto de grupo tem exatamente 4 membros.
Conteúdo
Capítulo 1 - Introdução a Data Mining
Capítulo 2 - Construir ABT
Capítulo 3. Combinar Datasets
Capítulo 4. Técnicas de Data Mining
Capítulo 5. Técnicas básicas de tratamento de dados
Capítulo 6. Lidar com valores omissos
Capítulo 7. Lidar com outliers e dados esparsos
Capítulo 8. Tópicos avançados em dados matching
Capítulo 9. Aspectos relacionados com o controlo de qualidade dos dados e privacidade
Capítulo 10. Visualização de dados