Análise de Equações Estruturais: abordagem de análise

analise-esquacoes-estruturais

A Análise de Equações Estruturais  (AEE) é uma extensão dos modelos lineares generalizados – Generalized Linear Models (GLM) – que permite ao investigador testar simultaneamente um conjunto de equações de regressão. Os softwares utilizados (SPSS AMOS ou LISREL, por exemplo) permitem testar desde os modelos mais simples (como os modelos de regressão, Anova e Ancova) até à análise das relações entre as varáveis de modelos mais complexos, como a análise factorial confirmatória e análises de séries temporais.

O diagrama seguinte ilustra a abordagem de base para a realização de uma análise de equações estruturais:
analise-esquacoes-estruturais
A abordagem básica para a realização de uma análise de equações estruturais assenta numa teoria, a partir da qual construímos o modelo a testar. Atendendo ao tipo de variáveis ou fatores envolvidos na teoria, construímos os instrumentos a utilizar na recolha dos dados empíricos. O software de análise estatística ajusta os dados ao modelo especificado e produz os resultados (que incluem as estatísticas gerais de ajustamento do modelo e as estimativas dos parâmetros).

Os inputs para a análise de equações estruturais são geralmente uma matriz de covariância de variáveis, medidas como scores, embora às vezes também se recorra às matrizes de correlações ou às matrizes de covariâncias e médias. O investigador fornece os dados em bruto, enquanto o analista converte estes dados em covariâncias e médias para proceder à análise.

O modelo consiste num conjunto de relações entre as variáveis medidas. Estas relações são então expressas como restrições sobre o conjunto total das relações possíveis.
analise-esquacoes-estruturais-matriz
Os resultados apresentam os índices de ajustamento do modelo, as estimativas dos parâmetros, os erros padrão e as estatísticas de teste para cada parâmetro livre no modelo.

Por fim, confrontamos os resultados obtidos com a teoria (ou a literatura) e nesta interpretação vamos confirmar, ou rejeitar, as hipóteses subjacentes ao modelo, analisar as relações entre as variáveis e avaliar a bondade de ajustamento do modelo proposto com base nos índices da bondade de ajustamento.

Análise estatística bivariada

A análise estatística bivariada (duas variáveis) permite observar como duas variáveis se comportam na presença uma da outra. Esta análise tanto pode ser feita em termos de distribuição (para duas variáveis ordinais) como em termos de frequências para variáveis nominais.

A tabela seguinte sistematiza os procedimentos de análise estatística bivariada, para os diferentes cenários possíveis.

PRINCIPAIS TÉCNICAS DA ANÁLISE DESCRITIVA BIVARIADA

 

  Variáveis Gráficos Quadros Medidas de Associação
Análise Bivariada Duas      

    Qualitativas

Nominal / Nominal Barras empilhadas a 100% Barras por grupos Tabela de Contingência V Cramer  0 ausência de relação

1 relação perfeita

Nomina l / Ordinal V Cramer  0 ausência de relação

1 relação perfeita

Ordinal /

Ordinal

Ró de Spearman (correlação ordinal) -1 relação perfeita negativa

0 ausência de relação

1 relação perfeita positiva

Quantitativa vs. Qualitativa Quantitativa / Nominal Diagrama de extremos e quartis, Linhas (perfil de médias) Tabela de comparação de medidas ETA (relação de dependência)  0 ausência de relação

1 relação perfeita

Qualitativa / Ordinal Ró de Spearman (correlação ordinal)  -1 relação perfeita negativa

0 ausência de relação

1 relação perfeita positiva

Duas Quantitativas Quantitativa / Quantitativa Diagrama de Dispersão  -1 relação perfeita negativa

0 ausência de relação

1 relação perfeita positiva

R de Pearson (correlação linear)  -1 relação perfeita negativa

0 ausência de relação

1 relação perfeita positiva

Nas tabelas de contingência para analisar a relação consideram-se as percentagens segundo a variável explicativa (independente). Quando não há relação de dependência interpretam-se as duas percentagens (em linha e em coluna).

Quando o objectivo é caracterizar a relação não se apresentam e interpretam as percentagens sobre o total.

Note-se que é possível realizar testes de hipóteses à nulidade dos coeficientes de associação V da Cramer, Spearman e Pearson, entre outros.

Em termos de representação gráfica, é ainda possível a representação através do diagrama de caixas. E quando estamos perante duas variáveis nominais podemos usar gráficos de barras ou os gráficos circulares.

boxplot_analise-estatistica.pt

Boxplot / Caixa de Bigodes / Diagrama de Caixas Representação gráfica da distribuição de variável quantitativa (pressão sistólica) por género, antes e depois do tratamento

 

grafico_barras_analise-estatística.pt

Gráfico de barras: Gastos no terceiro nível de educação (pós secundário) em 1999, no setor público e no setor privado (percentagem do PIB) nos países da OCDE. Análise bivariada: comparação da % do PIB entre dois grupos (setor público e privado do 3º nível de educação) para cada caso/ observação (país da OCDE).

Seleção, recolha, tratamento e análise de dados quantitativos

A escolha das técnicas de seleção, pesquisa, tratamento e análise de dados quantitativos é fundamental para qualquer tipo de investigação. É importante garantir escolhe os procedimentos e as técnicas mais adequadas aos seus dados, à natureza das variáveis, aos objetivos e às hipóteses da pesquisa. Estes tópicos farão parte do desenho metodológico do estudo. Nesta parte devem ser descritos e justificados os procedimentos e as técnicas de seleção da amostra; de recolha dos dados; os procedimentos para o tratamento dos dados empíricos (técnicas de classificação e codificação dos dados) e as técnicas de análise quantitativa.

Para a Seleção dos Dados Quantitativos recorremos às técnicas de amostragem.

1. Técnicas de Amostragem

  • Amostragem probabilística (por processo aleatório)
  • Amostragem não probabilística (por conveniência do investigador, ou por critério pessoal e subjetivo da população)

A Recolha dos Dados quantitativos pode ser feita através de diferentes técnicas de pesquisa.

2. Técnicas de Recolha de Dados Quantitativos:

  • Inquérito por Questionário
  • Inquérito por Entrevista
  • Testes Psicométricos
  • Escalas de Avaliação
  • Testes Formais

Numa fase posterior, o Tratamento dos Dados permite codificar, categorizar e agrupar os dados numa Base de Dados, onde se regista o comportamento das variáveis em estudo.

3. Técnicas de Classificação/ Codificação de Dados Quantitativos

  • Escala nominal ou ordinal
  • Escala intervalar ou absoluta
  • Valores discretos ou contínuos.

Depois de preparados e organizados os dados da pesquisa, estão reunidas as condições para se avançar para a análise exploratória e inferencial (se for o caso), através dos Procedimentos e das Técnicas Estatísticas: descritivas, de associação, de correlação, ou modelação, por exemplo.

4. Procedimentos e  Técnicas Estatísticas

  • Análise Exploratória dos Dados
  • Estudo da Normalidade e da Variância
  • Estatísticas de Localização, Dispersão e Variabilidade
  • Caraterização de Amostras Univariadas
  • Caraterização de Amostras Bivariadas e Multivariadas (Crosstabs)
  • Testes de Associação, Correlação e Testes de Hipóteses
  • Modelos Estatísticos
  • Análise Fatorial Exploratória e Confirmatória

Como saber qual a abordagem mais adequada ao seu estudo?

analise-tratamento-dadosPrimeiro terá de definir qual o problema/ problemática/ questão de estudo e os objetivos da sua análise. Dependendo da natureza (de estudo de caso, estudo amostral quantitativo ou qualitativo) da investigação, vai aplicar as técnicas de seleção, recolha, tratamento e análise dos dados adequadas à natureza do problema e, portanto, dos dados empíricos. Se tem dúvidas envie-nos uma mensagem para: geral@analise-estatistica.pt

Vantagens dos testes não paramétricos

analise-estatistica.pt-dados-quantitativos

Os testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição dos dados (normalidade e homogeneidade).

São considerados, por isso, também testes menos robustos que os testes paramétricos (Teste t e Anova). Apesar de algumas desvantagens, ou limitações, em determinados estudos e casos de análise, os testes não paramétricos podem ser vantajosos e, inclusive, apropriados.

Vantagens dos Testes Não Paramétricos:

  • Se a dimensão da amostra é muito pequena (N<30), pode não haver alternativa ao recurso dos testes não paramétricos, a não ser que a distribuição exata da população seja conhecida e a amostra seja, portanto, significativa;
  • Os testes não paramétricos exigem poucos pressupostos acerca dos dados e podem ser mais relevantes para uma determinada situação prática;
  • Os testes não paramétricos estão disponíveis para analisar dados medidos apenas numa escala ordinal – para este tipo de dados os testes paramétricos não se podem aplicar;
  • Existem testes não paramétricos para dados nominais, enquanto que os testes paramétricos não se podem aqui aplicar;
  • Existem testes não paramétricos adequados para amostras provenientes de diversas populações.

Desvantagens dos Testes Não Paramétricos:

  • Os testes não paramétricos permitem obter resultados mais robustos por serem mais potentes;
  • Se todos os pressupostos de um modelo estatístico paramétrico forem satisfeitos e as hipóteses puderem ser testadas através dos testes paramétricos, estes serão preteridos em relação aos primeiros.

Neste seguimento, podem ser ainda analisadas “As diferenças entre os testes paramétricos e os testes não paramétricos” num dos primeiros posts que publicamos.

Um exemplo da estatística não paramétrica é o Teste de Sinais para a mediana μ de uma amostra ou para a comparação de duas amostras emparelhadas, uma alternativa não paramétrica ao teste t para a média (ou comparação de médias em amostras emparelhadas). μ representa a mediana em vez da média.

Hipótese nula (H0) e hipótese alternativa (H1) o teste dos sinais para uma amostra
Este teste reduz-se ao teste Binomial (a uma proporção) averiguando se a proporção de observações acima (ou abaixo) da mediana pode ser considerada 1/2.
No caso de comparar duas amostras emparelhadas, o Teste dos Sinais averigua se a proporção de pares em que Xi > Yi pode ser considerada 1/2. Tal como no teste t, a comparação de duas amostras emparelhadas reduz-se ao teste para uma amostra aplicado às diferenças Di = Xi − Yi, em que as hipóteses são:
Hipótese nula (H0) e hipótese alternativa (H1) o teste dos sinais para duas amostras
No entanto, para a aplicação do Teste de Sinais  são exigidos três pressupostos.

Pressupostos estatísticos do Teste de Sinais:

  1. As observações (amostra original no caso de uma só amostra ou amostra das diferenças no caso de duas amostras) devem ser independentes e retiradas da mesma população (amostra aleatória);
  2. A variável de interesse é medida numa escala que seja, pelo menos ordinal;
  3. A estatística F da população X (caso de uma amostra) ou das diferenças D (caso de duas amostras) é contínua.

Existem outros testes não paramétricos, aplicados em situações de análise específica e também com os seus pressupostos e procedimentos. Num próximo artigo iremos apresentar outros testes não paramétricos com exemplos de aplicação.

Uma vez mais, esperamos ter ajudado a compreender melhor as vantagens dos testes não paramétricos, introduzindo também as diferenças destes em relação aos testes paramétricos.