Análise Avançada de dados

Objetivos

Este curso fornece uma introdução às técnicas avançadas de análise de dados, combinando a introdução aos algoritmos para processamento de dados e a execução distribuída de tais algoritmos. Dentro deste curso, os alunos irão adquirir conhecimentos e competências para o desempenho
análise avançada de dados, incluindo a seleção de ferramentas e algoritmos apropriados.


Caracterização geral

Código

67890

Créditos

3.5

Professor responsável

Nuno Manuel Ribeiro Preguiça

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Inglês

Pré-requisitos

N/A

Bibliografia

Moreira, João, Andre Carvalho, and Tomás Horvath. A General Introduction to Data Analytics. John Wiley & Sons, 2018.

Método de ensino

As aulas cobrirão os tópicos fundamentais do curso, ilustrados com problemas relevantes de análise de dados do mundo real e exemplos de codificação. As aulas incluirão algum tempo para perguntas e discussão.
Conjuntos de dados reais serão fornecidos aos alunos e serão usados ??sistematicamente como exemplos e cenários de treinamento. Espera-se que os alunos pratiquem e resolver os exercícios propostos de forma autônoma, mas parte do tempo de contato será dedicado à discussão de quaisquer problemas práticos que eles tenham incapazes de resolver por conta própria.

Método de avaliação

A avaliação desta unidade curricular consistirá em pequenos questionários / trabalhos práticos (25% da nota final) e num projeto de grupo maior (25% da nota final), em que o aluno coloca em prática as técnicas introduzidas nas aulas teóricas; e um teste intermediário (20% da nota final) e
um exame final (30% da nota final).

Período Regular de Exames:
4 quizzes/pequenos testes (25%)
Trabalho prático em equipa (25%);
Teste intermédio (20%);
Exame final (30%).

Conteúdo

A. Introdução ao Big Data
Desafios
Modelos de análise de dados
Aplicabilidade
B. Estruturas de processamento genéricas
Modelos de programação
Estrutura de processamento
C. Sistemas de programação para análise de dados
Infraestruturas de Big Data: por exemplo Azure HDInsight
Modelos e ambientes de programação: por exemplo Jupyter.
D. Limpeza de dados
Pré-processando
Reescalonamento
Qualidade de dados
E. Lidando com dados multidimensionais
Estatísticas descritivas e visualização
Seleção e extração de recursos para redução de dimensionalidade
F. Clustering
Tipos de agrupamento
Medidas de distância
G. Validação de clustering
Sistemas de processamento avançados
Sistemas específicos de domínio: processamento de gráficos e aprendizado de máquina
Processamento em tempo real

Cursos

Cursos onde a unidade curricular é leccionada: