Estatística Multivariada

Objetivos

Pretende-se familiarizar o aluno com técnicas de inferência para valores médios multivariados e matrizes de covariância, bem como modelos lineares em populações Gaussianas, métodos de redução da dimensionalidade, de discriminação e classificação de dados.

Caracterização geral

Código

8518

Créditos

6.0

Professor responsável

Regina Maria Baltazar Bispo

Horas

Semanais - 4

Totais - 56

Idioma de ensino

Português

Pré-requisitos

Noções básicas de Análise e de nível intermédio em Álgebra Linear, Probabilidades e Inferência Estatística

Bibliografia

Anderson, T. W. (2003), An Introduction to Multivariate Statistical Analysis, 3rd ed., J. Wiley & Sons, New York

Flury, B. (1997), A First Course in Multivariate Statistics, Springer. New York

Johnson, R. and Wichern, D. W. (2007), Applied Multivariate Statistical Analysis, 6th Edition, Prentice Hall, New Jersey

Morrison, D. F. (2004), Multivariate Statistical Methods, 4th Edition, Duxbury Press

Rencher, A. C. (1998), Multivariate Statistical Inference and Applications, John Wiley & Sons

Rencher, A. C. and Christensen, W. F. (2012). Methods of Multivariate Analysis, Third Edition, John Wiley & Sons

Zelterman, D. (2015). Applied Multivariate Statistics with R. Springer

Método de ensino

Aulas de EM: A distância, via Zoom: 

Semanalmente são disponibilizados vídeos das aulas TP. Os alunos deverão visualizar os vídeos antes da aula correspondente.

Pretende-se que as aulas funcionem de acordo com um modelo essencialmente interativo, de acompanhamento dinâmico dos alunos, com recurso à resolução prática de exercícios e análise de dados em ambiente R.

Os alunos são ainda convidados a semanalmente introduzirem termos no glossário.

Esclarecimento de dúvidas: Quartas das 15h às 16h. Link: https://videoconf-colibri.zoom.us/j/94690621777

Método de avaliação

Avaliação contínua:

  • Resolução de exercícios - Exercícios da semana (total de 12 fichas de exercícios, ponderação de 10%). A nota nesta componente é proporcional ao número de fichas entregues (por exemplo, um aluno que realizou 10/12 fichas, tem nota nesta componente igual a 17 valores). Todas as fichas devem ser entregues via moodle, em formato pdf, usando o template fornecido, na respetiva semana.
  • 1º teste -  Teste com consulta, a realizar a distância, via moodle, com uma ponderação de 20%. O teste terá a duração de 1h30m + 30m de tolerância. Durante a realização do teste, o docente estará online, via Zoom (link a disponibilizar oportunamente) para esclarecimento de eventuais dúvidas. O teste é classificado numa escala de 0 a 20 valores.
  • 2º teste -  Teste com consulta, a realizar a distância, via moodle, com uma ponderação de 20%. O teste terá a duração de 1h30m + 30m de tolerância. Durante a realização do teste, o docente estará online, via Zoom (link a disponibilizar oportunamente) para esclarecimento de eventuais dúvidas. O teste é classificado numa escala de 0 a 20 valores.
  • Trabalho - Trabalho individual de análise de dados multivariados. O trabalho terá uma ponderação de 50% e será entregue na última aula do semestre. O trabalho é classificado numa escala de 0 a 20 valores.

Recurso(Melhoria)/Especial: Prova escrita a distância (poderá ser presencial, se o número de alunos o permitir), numa única data, dentro da época prevista no calendário letivo, com ponderação de 100%. O exame terá a duração de 3h. O exame é classificado numa escala de 0 a 20 valores.

Conteúdo

Apresentação da docente e da unidade curricular

1. Revisões (Vetores e matrizes. Operações básicas. Transposição. Determinante de uma matriz. Matriz inversa. Traço de uma matriz. Valores e vetores próprios)

2. Dados multivariados

3. Distribuições multivariadas

4. Inferência sobre médias multivariadas

4.1 Inferência sobre um vetor de médias

4.2 Comparação de dois vetores de médias

4.3 Comparação de mais de 2 vetores de médias

5. Inferência sobre matrizes de covariâncias

6. Análise da estrutura de covariância

6.1  Análise em componentes principais

6.2  Análise de correlação canónica

7. Análise classificatória e de clustering

7.1  Análise discriminante

7.2  Análise de clusters