Estatística Multivariada

Objetivos

Pretende-se familiarizar o aluno com técnicas de inferência para valores médios multivariados e matrizes de covariância, bem como modelos lineares em populações Gaussianas, métodos de redução da dimensionalidade, de discriminação e classificação de dados.

Caracterização geral

Código

8518

Créditos

6.0

Professor responsável

Regina Maria Baltazar Bispo

Horas

Semanais - 4

Totais - 56

Idioma de ensino

Português

Pré-requisitos

Noções básicas de Análise e de nível intermédio em Álgebra Linear, Probabilidades e Inferência Estatística

Bibliografia

Anderson, T. W. (2003), An Introduction to Multivariate Statistical Analysis, 3rd ed., J. Wiley & Sons, New York

Flury, B. (1997), A First Course in Multivariate Statistics, Springer. New York

Johnson, R. and Wichern, D. W. (2007), Applied Multivariate Statistical Analysis, 6th Edition, Prentice Hall, New Jersey

Morrison, D. F. (2004), Multivariate Statistical Methods, 4th Edition, Duxbury Press

Rencher, A. C. (1998), Multivariate Statistical Inference and Applications, John Wiley & Sons

Rencher, A. C. and Christensen, W. F. (2012). Methods of Multivariate Analysis, Third Edition, John Wiley & Sons

Zelterman, D. (2015). Applied Multivariate Statistics with R. Springer

Método de ensino

As aulas decorrerão em modo presencial (se possível, a confirmar). Pretende-se que as aulas funcionem de acordo com um modelo essencialmente interativo, de acompanhamento dinâmico dos alunos, com recurso à resolução prática de exercícios e análise de dados em ambiente R.

Método de avaliação

Avaliação contínua:

Inclui as seguintes componentes:
  • 1º mini-teste (MT1)-  Teste com consulta, a realizar em laboratório de informática, presencialmente, através do moodle, com uma ponderação de 25%. O teste terá a duração de 2h. O teste é classificado numa escala de 0 a 20 valores (sem classificação mínima).
  • 2º mini-teste (MT2)-  Teste com consulta, a realizar em laboratório de informática, presencialmente, através do moodle, com uma ponderação de 25%. O teste terá a duração de 2h. O teste é classificado numa escala de 0 a 20 valores (sem classificação mínima).
  • Trabalho (T)- Trabalho individual de análise de dados multivariados. O trabalho terá uma ponderação de 50%. O trabalho é classificado numa escala de 0 a 20 valores.
Fórmula de cálcula da nota final (NF): NF = 0.25 x (MT1+ MT2) + 0.5 x T (notas parciais arredondadas a 1 casa decimal)

Recurso(Melhoria)/Especial: Prova escrita com consulta, presencial, a realizar numa única data, dentro da época prevista no calendário letivo, com ponderação de 100% (os alunos podem escolher realizar apenas parte da prova correspondente aos testes, assumindo-se neste caso os pesos correspondentes aos testes). Os alunos devem trazer para a prova os seu próprios computadores. O exame terá a duração de 3h (2 horas no caso de estar a realizar a parte correspondente aos testes). Classificação de 0 a 20 valores.

Conteúdo

Apresentação da docente e da unidade curricular

1. Introdução ao R/RStudio

2. Dados multivariados

3. Distribuições multivariadas

4. Inferência sobre médias multivariadas

4.1 Inferência sobre um vetor de médias

4.2 Comparação de dois vetores de médias

4.3 Comparação de mais de 2 vetores de médias

5. Inferência sobre matrizes de covariâncias

6. Análise da estrutura de covariância

6.1  Análise em componentes principais

7. Análise classificatória e de clustering

7.1  Análise discriminante

7.2  Análise de clusters