Análise de Dados

Objetivos

  1. Conhecimento e compreensão das principais técnicas de Análise Estatística Descritiva Multivariada ( AEDM )
  2. Apresentação de numerosas aplicações destas técnicas desenvolvendo análises univariadas , bivariadas e multivariadas associadas a matrizes de dados com variáveis quantitativas ou qualitativas.
  3. Uso do software SAS ( SAS Enterprise Guide ) no tratamento  estatístico de dados reais multivariados.

Caracterização geral

Código

200001

Créditos

7.5

Professor responsável

Paulo Jorge Mota de Pinho Gomes

Horas

Semanais - A disponibilizar brevemente

Totais - A disponibilizar brevemente

Idioma de ensino

Português. No caso de existirem alunos de Erasmus, as aulas serão leccionadas em Inglês

Pré-requisitos

Não se aplica.
 

Bibliografia

Branco João- uma Introdução à Análise de Clusters, Sociedade Portuguesa de Estatística 2004; Bry X. - Analyses Factorielles Multiples - Economica, Poche/Techniques quantitatives 1996; Escofier B. , Pagès J. - Analyses Factorielles Simples et Multiples, Dunod 1990; Gomes Paulo - Análise de Dados , ISEGI , 1993; Lebart L., Morineau A., Warwick K. -Multivariate D

Método de ensino

  1. O conteudo do curso é apresentado em Powerpoint mediante uma abordagem heurística e aulas teórico-práticas onde os alunos são confrontados desde a primeira aula com quadros de dados reais provenientes de vários ramos do conhecimento: pretende-se gerar um ambiente de aprendizagem e debate focalizado no aluno que contribua para  que o colectivo de alunos compreenda os alicerces das principais técnicas de análise de dados e por essa via captem o enorme campo de aplicação dos métodos de análise estatística descritiva e multivariada , nomeadamento no tratamento de dados de grandes dimensões, mas que sejam também capazes de identificar os limites desses métodos para dados mais complexos.
  2. Durante o curso são organizadas algumas aulas práticas em sala de computadores , procedendo-se ao tratamento de dados reais multivariados por recurso ao software SAS  ( SAS Enterprise Guide ) .
  3. Adicionalmente os alunos são convidados a colocar dúvidas e questões mais gerais em cada sessão ou posteriormente via e-mail alimentando um sistema FAQ que apoiará o processo de aprendizagem.

Método de avaliação

  1. O método de avaliação considera dois trabalhos de análise multivariada de dados e um exame final.
  2. O primeiro trabalho será proposto a meio do curso e permitirá avaliar o grau de conhecimento e compreensão do método base da Análise em componentes principais (ACP) e da respectiva adaptação ao tratamento de tabelas de contingencia ( Análise Factorial das Corespondencias, AFC ), nomeadamente no que diz respeito aos conceitos e definições inerentes a tais métodos e particularmente ao conjunto de indicadores de ajuda à interpretação dos dados.
  3. O segundo trabalho será proposto duas semanas antes do fim do curso tendo por objectivo principal a realização de uma análise estatística multivariada de dados reais, onde se espera que os alunos saibam recorrer a uma ou mais técnicas adequadas ao tratamento desses dados, usando o software SAS ( SAS Enterprise Guide ).
  4. Os trabalhos podem ser realizados individualmente ou em grupos com um máximo de três pessoas.
  5. O primeiro trabalho tem um peso de 0.2, o segundo trabalho um peso de 0.4 e o exame final um peso de 0.4.
  6. A classificação mínima em qualquer dos trabalhos ou no exame final é de oito valores.

Conteúdo

  1. Introdução.
  2. Análise em componentes principais descritiva ( ACP ): objectivo e ambito do método; interpretação geométrica da ACP ; ajustamento da nuvem de pontos-objecto no espaço p-dimensional;ajudas à interpretação; extensão- dupla análise em componentes principais para análise cúbica de dados; aplicações.
  3. Análise factorial das correspondencias enquanto caso particular de  uma ACP munida da métrica do qui-quadrado; generalização-análise factorial múltipla das correspondencias ; aplicações.
  4. Análise de clusters: métodos não hierárquicos e métodos hierárquicos ; aplicações.
  5. Recurso ao Software SAS ( SAS Enterprise Guide ) para o tratamento estatístico de dados reais multivariados.