Análise Avançada de dados
Objetivos
Este curso fornece uma introdução às técnicas avançadas de análise de dados, combinando a introdução aos algoritmos para processamento de dados e a execução distribuída de tais algoritmos. Dentro deste curso, os alunos irão adquirir conhecimentos e competências para o desempenho
análise avançada de dados, incluindo a seleção de ferramentas e algoritmos apropriados.
Caracterização geral
Código
2597
Créditos
3.5
Professor responsável
Nuno Ribeiro Preguiça | Ricardo Almeida E Silva
Horas
Semanais - A disponibilizar brevemente
Totais - A disponibilizar brevemente
Idioma de ensino
Inglês
Pré-requisitos
n/a
Bibliografia
Moreira, João, Andre Carvalho, and Tomás Horvath. A General Introduction to Data Analytics. John Wiley & Sons, 2018.
Método de ensino
As aulas cobrirão os tópicos fundamentais do curso, ilustrados com problemas relevantes de análise de dados do mundo real e exemplos de codificação. As aulas incluirão algum tempo para perguntas e discussão.
Conjuntos de dados reais serão fornecidos aos alunos e serão usados ??sistematicamente como exemplos e cenários de treinamento. Espera-se que os alunos pratiquem e resolver os exercícios propostos de forma autônoma, mas parte do tempo de contato será dedicado à discussão de quaisquer problemas práticos que eles tenham incapazes de resolver por conta própria.
Método de avaliação
Período Regular de Exames:
4 quizzes/pequenos testes (25%)
Trabalho prático em equipa (25%);
Teste intermédio (20%);
Exame final (30%).
Conteúdo
A. Introdução ao Big Data
Desafios
Modelos de análise de dados
Aplicabilidade
B. Estruturas de processamento genéricas
Modelos de programação
Estrutura de processamento
C. Sistemas de programação para análise de dados
Infraestruturas de Big Data: por exemplo Azure HDInsight
Modelos e ambientes de programação: por exemplo Jupyter.
D. Limpeza de dados
Pré-processando
Reescalonamento
Qualidade de dados
E. Lidando com dados multidimensionais
Estatísticas descritivas e visualização
Seleção e extração de recursos para redução de dimensionalidade
F. Clustering
Tipos de agrupamento
Medidas de distância
G. Validação de clustering
Sistemas de processamento avançados
Sistemas específicos de domínio: processamento de gráficos e aprendizado de máquina
Processamento em tempo real