Data Mining
Objectivos
Na conclusão do curso o aluno deverá:
- Discutir criticamente as principais noções e conceitos associados ao Data Mining;
- Evidenciar espírito crítico e capacidade de selecção das técnicas de preparação e pré-processamento de dados;
- Discutir o funcionamento, potencialidades e limitações das ferramentas estudadas (k-means, self-organizing maps, market basket analysis, árvores de decisão e perceptrão multi-camada);
- Evidenciar autonomia na busca e síntese de informação sobre os conceitos técnicos abordados durante a unidade curricular;
- Desenvolver autonomamente um projecto de segmentação de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
- Desenvolver autonomamente um projecto de scoring de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
- Desenvolver competências na comunicação escrita e oral de resultados.
Caracterização geral
Código
100031
Créditos
6.0
Professor responsável
Roberto André Pereira Henriques
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês
Pré-requisitos
Não existem requisitos de frequência.
Bibliografia
- Dean Abbott (2014) “Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst”, Wiley
- Daniel T. Larose, Chantal D. Larose (2015) “Data Mining and Predictive Analytics”, 2nd Edition, Wiley
- Mitchell, T., (1997) “Machine Learning”, McGraw Hill.
- Hand, D. J., Mannila, H., Smyth, P. (2001) “Principles of Data Mining (Adaptive Computation and Machine Learning)”, MIT Press.
- Collica, R. (2011), “Customer Segmentation and Clustering Using SAS Enterprise Miner” 2nd Edition, SAS Publishing
Método de ensino
A disciplina baseia-se em aulas teóricas, aulas práticas e na realização de tutoriais e exercícios. Nos tutoriais o aluno tem à sua disposição um ¿script¿ que lhe permite resolver o problema proposto, no caso dos exercícios é testada a autonomia do aluno.
Método de avaliação
1st term
- Exam (65%)
- Project 1 (15%)
- Project 2 (15%)
- 1 Practical handout (5%)
2nd term
- Exam (70%)
- Project 1 (15%)
- Project 2 (15%)
Conteúdo
- Introduction to Data Mining;
- Predictive and descriptive models;
- Inductive learning;
- Data Mining Methodology
- The process;
- The definition of the problem;
- the quality measurement;
- Data exploration;
- Visualization tools;
- Data pre-processing;
- Descriptive Models;
- Market basket analysis
- RFM Analysis;
- clustering algorithms
- K-Means;
- Self-Organizing Maps;
- Additional topics on the segmentation;
- Predictive Models
- Simple classifiers
- the Introduction to Bayesian classifiers
- Instance based classifiers
- Classification Trees - DDT, Cart and C 4.5
- Neural Networks - MLP
- Additional Topics on Predictive Modelling