Semin - PowerPoint PPT Presentation

1 / 37
About This Presentation
Title:

Semin

Description:

... Matriz dos dados ... Oblimin Promax V1 V2 V3 V4 V5 Fator II N O Rodado Fator I N O Rodado Fator rodado II Fator rodado I Rota o ortogonal V1 V2 V3 V4 V5 ... – PowerPoint PPT presentation

Number of Views:145
Avg rating:3.0/5.0
Slides: 38
Provided by: JorgeO153
Category:

less

Transcript and Presenter's Notes

Title: Semin


1
Seminário DEs/DEP
  • Algumas Técnicas Estatísticas Multivariadas
  • Parte I
  • Jorge Oishi

2
Técnicas Multivariadas
  • Tópicos abrangidos
  • Análise de Componentes Principais
  • Análise Fatorial
  • Análise Discriminante
  • Análise de Cluster
  • Análise de Correspondência

3
Técnicas Multivariadas
  • Conceitos básicos
  • Análise Multivariada todos os métodos
    estatísticos que simultaneamente analisam
    múltiplas medidas sobre cada indivíduo ou objeto
    sob investigação.
  • Qualquer análise de duas ou mais variáveis, pode
    ser considerada análise multivariada.
  • Para ser considerada verdadeiramente como
    multivariada, todas as variáveis devem ser
    aleatórias e inter-relacionadas, de modo que seus
    efeitos não podem ser interpretados de forma
    separada.

4
Técnicas Multivariadas
  • Estrutura dos dados

X1 X2 ... Xp
Caso 1 x11 x12 ... x1p
Caso 2 x21 x22 ... x2p
.... ... ... ... ..

Caso n xn1 xn2 ... xnp
5
Técnicas Multivariadas
  • OBJETIVOS
  • Redução dos dados ou simplificação estrutural
  • O fenômeno sendo estudado é representado o mais
    simplificado possível sem o sacrifício de
    informações valiosas
  • Ordenação e agrupamento
  • Grupos de objetos ou variáveis são criadas
    baseadas nas características mensuradas
  • Investigação da dependência entre variáveis
  • A natureza do relacionamento entre as variáveis é
    de interesse. Todas as variáveis são mutuamente
    ou são uma ou mais variáveis dependentes das
    outras? Como é essa relação?

6
Técnicas Multivariadas
  • OBJETIVOS
  • Previsão
  • O relacionamento entre variáveis deve ser
    determinado com o propósito de fazer previsão dos
    valores de uma ou mais variáveis com base na
    observação das outras variáveis
  • Construção e testes de hipóteses
  • Hipóteses estatísticas, formuladas em termos de
    parâmetros de populações multivariadas podem ser
    testadas.

7
Técnicas Multivariadas
  • Variáveis dois tipos de classificações
  • Quanto a resposta
  • Métricas discretas ou contínuas
  • Não métricas nominais ou ordinais
  • Quanto ao uso
  • Dependentes ou respostas
  • Independentes ou explanatórias

8
Técnicas Multivariadas
  • Classificação das Técnicas
  • Forma geral
  • Vetores de variáveis
  • Classificação das técnicas depende
  • Da dependência ou independências das variáveis
  • Do número de variáveis dependentes
  • Do tipo de escala (métrica, não-métrica)

9
Técnicas Multivariadas
  • Técnica de Dependência
  • É aquela na qual uma variável ou um conjunto de
    variáveis é identificado como variável dependente
    a ser predita ou explicada por outras variáveis
    independentes
  • Técnica de Interdependência
  • É aquela na qual nenhuma das variáveis é definida
    como dependente ou independente, mas o
    procedimento envolve a análise simultânea de
    todas as variáveis no conjunto.

10
Técnicas Multivariadas
  • Técnicas de Dependência
  • Podem ser classificadas por duas características
  • O número de variáveis dependentes,
  • O tipo de escala das variáveis.
  • Exemplos de técnicas
  • Regressão Linear Múltipla
  • MANOVA
  • Análise Discriminante
  • Análise de Correlação Canônica
  • Análise Conjunta

11
Técnicas Multivariadas
  • Técnicas de Interdependência
  • Depende da estrutura procurada
  • Estrutura de variáveis
  • Estrutura de casos
  • Estrutura de objetos (da matriz de dados).
  • Exemplos
  • Análise Fatorial
  • Análise de Cluster
  • Escalonamento Multidimensional
  • Análise de Correspondências

12
Técnicas Multivariadas
  • Se Y1 métrica e Xi todas métricas ? Regressão
    Linear Múltipla
  • Se Y1 não-métrica e Xi todas métricas ? Análise
    Discriminante Múltipla
  • Se Y1 métrica e Xi todas não métricas ? ANOVA
  • Se Y1 métrica ou não-métrica e Xi todas não
    métricas ? Análise Conjunta

13
Técnicas Multivariadas
  • Se Yi todas métricas e Xi todas não-métricas ?
    MANOVA
  • Se Yi métricas ou não-métrica e Xi métricas ou
    não-métricas ? Análise de Correlação Canônica

14
Análise de Componentes Principais
  • Pearson (1901) e Hotelling (1933)
  • O objetivo principal é a obtenção de um pequeno
    número de combinações lineares (componentes
    principais) de um conjunto de variáveis, que
    retenham o máximo possível da informação contida
    nas variáveis originais.
  • Redução dos dados originais
  • Facilitar a interpretação através da descoberta
    de relacionamentos não suspeitos previamente.

15
Análise de Componentes Principais
  • A análise de componentes principais substitui um
    conjunto de variáveis correlacionadas por um
    conjunto de novas variáveis não-correlacionadas,
    sendo essas combinações lineares das variáveis
    iniciais e colocadas em ordem decrescente por
    suas variâncias
  • Var CP1 gt Var CP2 gt .... gt Var CPp

16
Análise de Componentes Principais
  • Algebricamente, componentes principais são
    combinações lineares particulares das p
    variáveis aleatórias X1, X2, ..., Xp
  • Geometricamente, essas combinações lineares
    representam a relação de um novo sistema de
    coordenadas obtido por deslocamento e rotação do
    sistema original com X1, X2, ..., Xp como eixos
  • Os novos eixos representam as direções com
    variabilidade máxima e fornecem uma descrição
    mais simples e mais parcimoniosa da estrutura de
    covariância
  • Os componentes principais dependem da matriz de
    correlação (r) ou da matriz de covariâncias (?)
    de X1, X2, ..., Xp. O seu desenvolvimento não
    necessita da suposição de normalidade.

17
Análise de Componentes Principais
  • Exemplos
  • Aplicação na confiabilidade de sistemas complexos
    redução no conjunto de variáveis originais
    (peças) para três variáveis (componentes
    principais) e no final o estudo mostrou que
    bastava apenas o primeiro deles.
  • Análise de componentes principais em imagens
    multi-temporais de satélites para estudo de
    vulnerabilidade à perda de solo no semi-árido
    nordestino. Basicamente foi utilizada a ACP para
    reunir as informações de duas imagens para compor
    duas outras, não correlacionadas entre si, com
    melhores propriedades interpretativas.

18
Análise de Componentes Principais
19
Análise de Componentes Principais
20
Análise de Componentes Principais
21
Análise de Componentes Principais
22
Análise de Componentes Principais
  • Seleção do número de componentes
  • Kaiser ou Método da Raiz Latente autovalores
    maiores que 1 (Johnson 0,7)
  • Scree test gráfico dos autovalores.

23
Análise de Componentes Principais
  • Após a seleção dos componentes, a elaboração do
    gráficos dos dois primeiros componentes pode ser
    muito útil para entender a relação entre as
    variáveis e os componentes
  • Se apenas os dois primeiros componentes
    explicarem mais de 80 ou 90 da variabilidade
    total das variáveis originais isto significa que
    o fenômeno sob estudo pode ser muito
    simplificado
  • No primeiro exemplo, de 80 variáveis originais
    apenas três componentes explicam quase tanto
    quanto os 80 e, no final, apenas o primeiro
    componente já foi suficiente para o objetivo do
    trabalho.

24
Análise Fatorial
  • Spearman (1904), Pearson e Hotelling (1933)
  • Objetivo
  • Analisar as inter-relações entre um grande número
    de variáveis em termos de poucas, mas não
    observáveis, variáveis chamadas fatores.
  • Verificar se é possível descrever um conjunto de
    p variáveis em um conjunto menor de índices ou
    fatores que explicam tanto sobre o fenômeno,
    que o conjunto original.
  • Surgiu da tentativa de definir e medir
    constructos, tais como Inteligência, Amor, etc.

25
Análise Fatorial
  • Raciocínio suponha que variáveis possam ser
    agrupadas segundo suas correlações, isto é, que
    todas as variáveis dentro de um grupo sejam
    altamente correlacionadas entre si, mas tenham
    correlações muito baixas com as variáveis de
    outros grupos.
  • A idéia por trás da Análise Fatorial é que cada
    grupo de variáveis representa um constructo
    básico, que é o responsável pelas correlações
    observadas nas respostas.

26
Análise Fatorial
  • Dados as variáveis X1, X2,..., Xp
  • Existem F1, F2, ..., Fm, onde m lt p tal que
  • X1 a11F1 a12F2 a1mFm ?1
  • X2 a21F1 a22F2 a2mFm ?2
  • Xp ap1F1 ap2F2 apmFm ?p ?

27
Análise Fatorial
  • De forma visual, os dados originais formam uma
    nuvem de pontos num espaço de p-dimensional.
  • A transformação de X em F permite transportar os
    pontos do espaço p-dimensional para um espaço
    m-dimensional com menos dimensões, e portanto
    mais fácil de interpretar.
  • Por isso é importante que m não seja maior que 2
    ou 3.

28
Análise Fatorial
  • Na Análise Fatorial são calculados os
    coeficientes aij denominados de cargas
    fatoriais e os Fatores Fi.
  • Suposições
  • Fi e ?i são variáveis com médias 0 e variância 1
  • ?aij2 proporção da variância de Xi que é devido
    ao fator Fi é chamada de Comunalidade de Xi.

29
Análise Fatorial
  • Não existe uma solução única para a AF de um
    conjunto de dados, mas apenas dois princípios
    básicos que se deve ter em conta
  • Princípio de Parcimônia Tem-se que explicar as
    correlações entre as variáveis observadas
    utilizando o menor número de fatores possível.
  • Interpretabilidade Deseja-se que os fatores
    tenham um significado no contexto estudado,
    guardando em si mesmos uma coerência lógica.

30
Análise Fatorial
  • Há dois tipos de aplicação e de entendimento da
    AF
  • Análise fatorial Exploratória mais antiga ?
    buscar dimensões subjacentes, para saber o que é
    mais importante ou mais significativo de um
    conjunto de variáveis.
  • Analise fatorial Confirmatória se desenha uma
    estrutura dos fatores e em seguida, busca-se a
    confirmação desta, estudando as variáveis
    observadas. (uso em modelagem de comportamento).

31
Análise Fatorial
  • Métodos de extração dos fatores
  • Componentes Principais
  • Fator Principal com várias alternativas
  • Método do Eixo Principal
  • Método do Centróide
  • Máxima Verossimilhança
  • Comunalidades

32
Análise Fatorial
  • Entrada dos dados para análise
  • Matriz dos dados brutos
  • Matriz de correlações
  • Saídas
  • Autovalores
  • Matriz de cargas fatoriais sem rotação
  • Rotação dos fatores ortogonais e obliquas
  • Coeficientes fatoriais

33
Análise Fatorial
  • Rotações ortogonais
  • Varimax
  • Quartimax
  • Equamax
  • Rotações Obliquas
  • Oblimin
  • Promax

34
Fator II NÃO Rodado
Fator rodado II
Rotação ortogonal
V1
V2
Fator I NÃO Rodado
V3
V4
V5
Fator rodado I
35
Fator II NÃO Rodado
Rotação oblíqua
Fator rodado ortog. II
Fator rodado II oblíquo
V1
V2
Fator I NÃO Rodado
V3
V4
Fator rodado I Oblíquo
V5
Fator rodado ortog. I
36
(No Transcript)
37
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com