Métodos Preditivos de Data Mining

Objetivos

A unidade curricular de Data Mining tem como objetivo principal fornecer aos estudantes uma compreensão fundamental da análise preditiva no que se refere à melhoria do desempenho empresarial. Este curso abordará os conceitos básicos de análise preditiva e modelagem de dados para determinar quais algoritmos usar e entender as semelhanças e diferenças e quais opções afetam mais os modelos. Os tópicos abordados incluem algoritmos de análise preditiva para aprendizagem supervisionada, incluindo árvores de decisão, redes neuronais, k-Nearest Neighbors mais próximos e conjuntos de modelos. No final do curso, os participantes serão capazes de usar essas habilidades para produzir um conjunto de dados completamente processado compatível com a construção de modelos preditivos poderosos que podem ser implementados para aumentar o lucro.

Caracterização geral

Código

200166

Créditos

7.5

Professor responsável

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

Conhecimento básico de Python é necessário.

Aprovação na Unidade Curricular de Métodos Descritivos de Data Mining é aconselhável.

Bibliografia

•    Data Mining and Predictive Analytics, Daniel T. Larose, Chantal D. Larose, Wiley, 2015 
•    Applied Predictive Analytics: Principles and Techniques for the Professional Data Analyst, Dean Abbott Wiley, 2014 
•    Machine Learning, Tom M. Mitchell, McGraw Hill, 1997 
•    Pattern Recognition and Machine Learning, Christopher M. Bishop
 

Método de ensino

O curso é baseado em uma mistura de aulas teóricas e aulas e tutoriais práticos. As sessões teóricas incluem a apresentação de conceitos e metodologias teóricas, bem como exemplos de aplicação. O principal objetivo das aulas práticas é familiarizar os alunos com o software para realizar análises e tarefas de exploração de dados.

Método de avaliação

Período regular (1º período de exame)
• Exame (60%)
• Projeto (40%)

Período regular (final do período de exame)
• Exame (60%)
• Projeto (40%)

Nota mínima de 8,0 (em 20) para o exame e para o projeto.

Conteúdo

O curso é dividido em unidades de aprendizagem (LU) da seguinte forma:
LU1. Introdução à modelação preditiva
LU2. Pré-processamento de dados
LU3. Introdução a classificadores
a.    Bayesian learning systems 
b.    Instance-based learning and classification 
c.    Regression and classification trees 
d.    Ensemble classifiers 
e.    Neural Networks
LU4. Avaliação de modelos preditivos
LU5. Desenvolver um projeto usando Python