Data Mining

Objectivos

Na conclusão do curso o aluno deverá:

  • Discutir criticamente as principais noções e conceitos associados ao Data Mining;
  • Evidenciar espírito crítico e capacidade de selecção das técnicas de preparação e pré-processamento de dados;
  • Discutir o funcionamento, potencialidades e limitações das ferramentas estudadas (k-means, self-organizing maps, market basket analysis, árvores de decisão e perceptrão multi-camada);
  • Evidenciar autonomia na busca e síntese de informação sobre os conceitos técnicos abordados durante a unidade curricular;
  • Desenvolver autonomamente um projecto de segmentação de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
  • Desenvolver autonomamente um projecto de scoring de uma base de dados, mostrando competência técnica na utilização das ferramentas requeridas e capacidade de justificação das opções feitas;
  • Desenvolver competências na comunicação escrita e oral de resultados.

Caracterização geral

Código

100031

Créditos

6.0

Professor responsável

Roberto André Pereira Henriques

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

Não existem requisitos de frequência.

Bibliografia

  • Dean Abbott (2014) “Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst”, Wiley
  • Daniel T. Larose, Chantal D. Larose (2015) “Data Mining and Predictive Analytics”, 2nd Edition, Wiley
  • Mitchell, T., (1997) “Machine Learning”, McGraw Hill.
  • Hand, D. J., Mannila, H., Smyth, P. (2001) “Principles of Data Mining (Adaptive Computation and Machine Learning)”, MIT Press.
  • Collica, R. (2011), “Customer Segmentation and Clustering Using SAS Enterprise Miner” 2nd Edition, SAS Publishing

Método de ensino

A disciplina baseia-se em aulas teóricas, aulas práticas e na realização de tutoriais e exercícios. Nos tutoriais o aluno tem à sua disposição um ¿script¿ que lhe permite resolver o problema proposto, no caso dos exercícios é testada a autonomia do aluno.

Método de avaliação

1st term

  • Exam (65%)
  • Project 1 (15%)
  • Project 2 (15%)
  • 1 Practical handout (5%)

2nd term

  • Exam (70%)
  • Project 1 (15%)
  • Project 2 (15%)

Conteúdo

  • Introduction to Data Mining;
  • Predictive and descriptive models;
  • Inductive learning;
  • Data Mining Methodology
    • The process;
    • The definition of the problem;
    • the quality measurement;
  • Data exploration;
  • Visualization tools;
  • Data pre-processing;
  • Descriptive Models;
    • Market basket analysis
    • RFM Analysis;
    • clustering algorithms
      • K-Means;
      • Self-Organizing Maps;
      • Additional topics on the segmentation;
  • Predictive Models
    • Simple classifiers
    • the Introduction to Bayesian classifiers
    • Instance based classifiers
    • Classification Trees - DDT, Cart and C 4.5
    • Neural Networks - MLP
  • Additional Topics on Predictive Modelling

Cursos

Cursos onde a unidade curricular é leccionada: