Disciplina: Análise de Dados Multivariados
Área Científica:
Matemática
HORAS CONTACTO:
80 Horas
NÚMERO DE ECTS:
7,5 ECTS
IDIOMA:
Português
Objetivos Gerais:
1 - Esta UC tem como objetivo fornecer uma panorâmica razoavelmente ampla das metodologias estatísticas mais comuns para análise de dados multivariados e, assim, sensibilzar os alunos para que seja privilegiada uma abordagem multivariada quando se dispõe de uma grande quantidade de informação estatística.
2 - Também nesta unidade curricular o aluno adquirirá a capacidade de trabalhar com um software de estatística (SPSS), para tratar bases de dados que lhe serão facultadas nas aulas teórico-práticas.
3 - Finalmente, a unidade curricular irá apetrechar os alunos das técnicas estatísticas para abordar bases de dados provenientes de estudos de investigação em áreas da ciência muito diversas. Sensibilizará o aluno para a capacidade adquirida para realizar investigação, para interpretar, modelar e comunicar resultados da área da Análise Multivariada de Dados Estatísticos de forma efetiva.
Conteúdos / Programa:
1 - Análise de Variância Dupla. Definição dos modelos de efeitos fixos e de efeitos aleatórios, decomposição da soma de quadrados, testes aos parâmetros dos modelos, grupos com diferentes números de observações. Verificação da adequabilidade do modelo. Seleção de uma transformação para estabilizar a variância. Comparações múltiplas na análise de variância múltipla. Modelo para medições repetidas e modelo para a classificação encaixada (modelo misto).
2 - Regressão Múltipla. O modelo linear generalizado; hipóteses subjacentes ao modelo; estimação de parâmetros; técnicas de seleção de variáveis; análise dos resíduos. Ajustamento do modelo. Testes e intervalos de confiança para os coeficientes do modelo. Variáveis qualitativas. Coeficientes de regressão estandardizados. Precisão da equação de regressão. Coeficiente de correlação parcial e teste F-parcial. A escolha do melhor modelo de regressão. Deteção de outliers e diagnóstico de influência.
3 - Regressão Logística. Noções básicas de epidemiologia. O modelo simples e o modelo múltiplo. Referência à regressão logística politómica. Odds ratio e risco relativo; logit. Ajustamento do modelo e testes aos parâmetros do modelo e construção dos respetivos intervalos de confiança. Interações no modelo de regressão logística. Diagnóstico de influência.
4 - Análise em Componentes Principais. Sobre o cálculo das componentes principais; scores das componentes principais; as várias formas de X'X e a interpretação das componentes principais usando correlações; componentes principais estandardizadas; variância explicada; quantas componentes principais reter; regras de paragem. Rotação e interpretação das componentes principais.
5 - Análise de Clusters. Formulação probabilística. Métodos hierárquicos e métodos não hierárquicos. Medidas de distância e de proximidade. Correlação Cophenetic e validade dos clusters. Escolha do número de clusters. Dendrograma.
Bibliografia / Fontes de Informação:
Montgomery D. C. , 1997 , Design and Analysis of Experiments. , Wiley
Boniface D. R. , 1995 , Experimental Design and Statistical Methods for Behavioral and Social Research , Chapman and Hall
Cobb G. W. , 1998 , Introduction to Design and Analysis of Experiments , Springer
Draper N. R., Smith H. , 1998 , Applied Regression Analysis , Wiley
Johnson D. E. , 1998 , Applied Multivariate Methods for Data Analysts , Duxbury Press & Brooks/Cole
Mendenhall W., Sincich T. , 2003 , A Second Course in Statistics: Regression Analysis , Prentice & Hall
Hosmer D. W., Lemeshow S. , 1989 , Applied Logistic Regression , Wiley
Mardia K. V., Kent J. T., and Bibby J. M. , 1997 , Multivariate Analysis , Academic Press
Wackerly D. D., Mendenhall W., Scheaffer R. L. , 2002 , Mathematical Statistics with Applications , Duxbury
Field A. , 2011 , Discovering Statistics Using SPSS , Cengage Learning
Marôco J. , 2014 , Análise Estatística com o SPSS Statistics , Report Number
Pallant J. , 2013 , SPSS Survival Manual: A Step by Step Guide to Data Analysis Using IBM SPSS , McGraw-Hill
Pestana M. H., Gageiro J. N. , 2014 , Análise de Dados para as Ciências Sociais - A Complementaridade do SPSS , Edições Sílabo
Zar J. H. , 1999 , Biostatistical Analysis , Prentice Hall International
Scheffé H. , 1959 , The Analysis of Variance , John Wiley
Casella G., Berger R. L. , 1990 , Statistical Inference , Duxbury
Rohatgi V. K. , 1976 , An Introduction to Probability Theory and Mathematical Statistics , John Wiley and Sons
Kline P. , 2000 , An Easy Guide to Factor Analysis , Routledge
Everitt B. S., Landau S., Leese M. , 2001 , Cluster Analysis , Arnold
Glantz S. A., Slinker B. K. , 2001 , Primer of Applied Regression and Analysis of Variance , McGraw-Hill
Mead R. , 1992 , The Design of Experimentals: Statistical Principles for Practical Applications , Cambridge University Press
Cochran W. G., Cox G. M. , 1957 , Experimental Designs , John Wiley & Sons
Armitage P., Berry G. , 1994 , Statistical Methods in Medical Research , Blackwell Science
Marôco J. , 2010 , Análise de Equações Estruturais: Fundamentos Teóricos, Software and Aplicações , Report Number
Métodos e Critérios de Avaliação:
Tipo de Classificação: Quantitativa (0-20)
Metodologia de Avaliação:
Aulas expositivas (da exclusiva responsabilidade do docente). Aulas teórico-práticas para aplicações, com recurso ao software SPSS, realizadas pelos alunos com alguma intervenção do docente. Apresentações (realizadas pelos alunos). Avaliação: Um trabalho individual, com apresentação e discussão oral. O trabalho, teórico, tem como objetivo levar o aluno a perceber que é capaz de estudar assuntos novos sozinho e a preparar uma comunicação, apresentá-la e discuti-la. Ponderação 50%. Uma avaliação final oral, individual, de índole teórico-prática que consiste numa aplicação de uma ou mais técnicas de análise de dados multivariados a uma base de dados fornecida ao aluno. A justificação para a avaliação teórico-prático é levar o aluno a autonomizar-se na realização de uma análise de dados multivariados e na elaboração do respetivo relatório. Ponderação 50%.