Bases de dados oficiais de acesso livre

técnicas de pesquisa analise-estatistica.pt

Existem várias plataformas que publicam e divulgam dados estatísticos oficiais em diversas áreas, como economia, macroeconomia, comportamento social e político, dados médicos. Aqui estão algumas das principais fontes:

  1. Bancos de Dados Internacionais:

    • Banco Mundial: Oferece uma ampla gama de dados económicos, sociais e ambientais de todo o mundo.
    • Fundo Monetário Internacional: Fornece dados macroeconômicos, financeiros e de balança de pagamentos para os países de todo o mundo.
  2. Governo e Instituições Nacionais:

    • Instituto Nacional de Estatística: Cada país possui um instituto nacional de estatística que recolhe e divulga dados económicos, sociais e demográficos. 
    • Ministérios e Agências Governamentais: Muitos ministérios e agências governamentais também disponibilizam dados específicos da sua área de intervenção (saúde, educação, comércio, agricultura, etc.).
  3. Organizações Internacionais:

    • Organização das Nações Unidas: A ONU possui diversos programas e agências que recolhem e partilham dados em várias áreas, como a UNICEF, OMS, PNUD, entre outros.
    • Organização para a Cooperação e Desenvolvimento Económico: A OCDE divulga dados económicos e sociais sobre os países membros.
  4. Bancos Centrais:

    • Banco Central de cada país: Geralmente disponibilizam dados económicos, financeiros e monetários relacionados com o país.
  5. Organizações de Saúde:

    • Organização Mundial da Saúde: A OMS disponibiliza dados globais sobre saúde, doenças e indicadores de saúde.
    • Centros de Controlo e Prevenção de Doenças: São a principal fonte de dados médicos e de saúde nos Estados Unidos da América.

É sempre importante verificar a fonte e a credibilidade dos dados. Cada fonte tem as suas próprias interfaces e métodos de acesso aos dados, mas permitem o acesso a uma ampla variedade de dados, agregados ou não.

Bases de dados oficiais

Estes são alguns links de plataformas que disponibilizam dados oficiais de acesso livre, em diferentes áreas.


Se procura algum tipo de dados em concreto e não sabe onde encontrar, peça-nos ajuda! Se conhece outras bases de dados, deixe-nos uma mensagem com a sua referência.
Ajude-nos a tornar mais completa a nossa lista!

Como desenvolver uma análise estatística robusta?

R Statistics_analise-estatistica

Desenvolver análises robustas e potentes é uma preocupação de todo o investigador.

É por isso que a pergunta mais frequente que recebemos seja: “Qual o tamanho que deve ter a minha amostra?”.  A resposta a esta pergunta é influenciada por uma série de fatores, incluindo o objetivo do estudo, o tamanho da população, o risco associado ao estudo de uma amostra “má” e o erro de amostragem permitido.

Para melhor estimar o tamanho da amostra, ou para validar que a amostra definida é suficiente, pode ser desenvolvida uma análise do poder da amostra, assim como um estudo piloto de parte dos dados recolhidos. Através da literatura relevante podem ser identificados parâmetros que ajudem a definir o desenho da pesquisa.

Há três considerações importantes a fazer na análise de poder para determinação do tamanho da amostra, sendo todas elas consideradas ao fazer sua análise de poder:

  • A abordagem geral para determinar o tamanho da amostra pressupõe que uma amostra aleatória simples é o desenho de amostragem. Desenhos mais complexos, por exemplo, amostras aleatórias estratificadas, devem ter em conta as variâncias de sub-populações, estratos ou agrupamentos antes de se poder fazer uma estimativa da variabilidade da população como um todo.
  • O tamanho da amostra deve ser apropriado à análise planeada. Se recorrer à estatística descritiva, por exemplo, então qualquer tamanho de amostra razoável será suficiente. Por outro lado, geralmente é necessária uma amostra de bom tamanho, aproximadamente n = 150 + quando pretendemos desenvolver um modelo de regressão múltipla, ou logística, análise de covariância ou análise log-linear, que pode ser realizada para avaliações de impacto mais rigorosas. Por outro lado, pode ser necessário fazer um ajuste no tamanho da amostra para se proceder a uma análise comparativa de grupos (por exemplo, a avaliação dos participantes do programa versus os não participantes, ou a comparação entre o grupo de teste e o grupo de controlo). Além disso, distribuições distorcidas podem resultar em sérios desvios à normalidade, mesmo para amostras de tamanho moderado, causando a necessidade de ter uma amostra maior.
  • Finalmente, as fórmulas do tamanho da amostra fornecem as respostas que precisam ser obtidas. Muitos investigadores adicionam 25% + para o tamanho da amostra planeada para compensar as pessoas que o pesquisador venha a excluir da amostra, por algum motivo. O número de pesquisas recolhidas ou entrevistas realizadas também pode ser substancialmente maior do que o número necessário, com base na taxa de resposta assumida.

Também podemos realizar análises de poder em estudos psicométricos mais complexos recorrendo à modelação de equações estruturais. Para este tipo de estudo, precisaríamos de conhecer alguns detalhes do estudo, sobre como pretende configurar a análise de equações estruturais (quais variáveis latentes, indicadores, correlações, etc.). Em seguida, conduziríamos a análise de poder com base nos métodos descritos em McCallum, Browne, Sugawara (1996, também citados em Kline (2016) Princípios e Práticas de Modelação de Equações Estruturais, 4ª edição). Este método envolve a realização de uma análise personalizada para o cálculo da potência e do tamanho da amostra necessários para aceitar ou rejeitar a hipótese nula de que o modelo apresenta um bom ajustamento aos dados, com base na métrica RMSEA (Root Mean Square Error of Approximation) – Ler mais.

Se precisar de uma análise do poder da amostra na fase inicial do seu projeto de investigação, é algo que podemos ajudar. Fale connosco por e-mail sobre o seu projeto de investigação. Bom trabalho!

Cuidados a ter numa análise de conteúdo

analise-de-conteudo-dados qualitativos

Na análise de conteúdo sugerimos alguns cuidados para assegurar o rigor e a relevância científica de uma pesquisa:

  • Trabalhar com amostras reunidas de forma sistemática;
  • Questionar a validade dos procedimentos de recolha dos dados;
  • Trabalhar com codificadores e categorias que permitam a verificação da fidelidade dos resultados;
  • Conjugar a análise interpretativa com a análise de frequências;
  • Medir a produtividade da análise.

A fidelidade do instrumento depende do processo de codificação, isto é, do codificador e do instrumento de codificação que ele dispõe.

A fidelidade do codificador permite que o mesmo codificador, aplicado em momentos diferentes ao mesmo texto, produz os mesmos resultados nos dois momentos. A fidelidade das categorias de análise assegura que as unidades de análise reúnam consenso e entendimento entre diferentes investigadores/ leitores. Trata-se aqui de evitar a ambiguidade das categorias de análise de forma a poderem ser classificadas e compreendidas, sem dificuldade ou dúvidas.

A validade da análise  é definida como a adequação entre os objetivos e as etapas de análise definidas. Na definição das etapas de aplicação do instrumento de investigação deve ser considerada: a representatividade da amostra, a escolha das categorias de análise, das unidades de registo e dos índices de quantificação.

O conceito de validade além da sua dimensão metodológica, é um conceito que deriva dos objetivos definidos para a investigação. Por isso são apontadas quatro tipos de  validade:

  • A validade do conteúdo
  • A validade preditiva
  • A validade comparativa
  • A validade comparativa
  • A validade interpretativa

Para ilustrar e compreender melhor a distinção entre os quatro tipos de validade, consideramos uma investigação sobre a vivência do alcoólico, analisada com base num conjunto de rácios sintáticos que permitem identificar diferentes fases na vivência do alcoólico.

Exemplo de um Caso de Estudo sobre a Vivência do Alcoólico

Os rácios sintáticos foram construídos com base na seleção frequencial de palavras (verbos, adjetivos, nomes, etc).

  • Se quisermos medir o vocabulário dos alcoólicos estaríamos interessados na validade do conteúdo.
  • Se quisermos predizer a duração da desintoxicação seríamos remetidos para a validade preditiva.
  • Para comparar o vocabulário dos alcoólicos e o dos não alcoólicos, teríamos de ponderar a validade comparativa.
  • Se o objetivo fosse fazer inferências  sobre as capacidades mnemónicas dos alcoólicos, estaríamos perante um caso de validade interpretativa.

Portanto, a validade é uma noção metodológica que advém dos objetivos da investigação.

Em síntese, a análise de conteúdo é uma técnica de investigação que permite a descrição sistemática, objectiva e quantitativa do conteúdo das comunicações. Pode ser aplicada a variados campos, como a imprensa, discursos políticos, diários, estudos bíblicos, respostas a perguntas abertas, etc.

A análise de conteúdo implica a existência de objectivos formulados com base num quadro referencial teórico que fundamenta e orienta a definição de categorias de análise, de unidades de análise e a constituição do corpus que vai ser objecto de aplicação desta técnica.

Análise de Equações Estruturais: abordagem de análise

analise-esquacoes-estruturais

A Análise de Equações Estruturais  (AEE) é uma extensão dos modelos lineares generalizados – Generalized Linear Models (GLM) – que permite ao investigador testar simultaneamente um conjunto de equações de regressão. Os softwares utilizados (SPSS AMOS ou LISREL, por exemplo) permitem testar desde os modelos mais simples (como os modelos de regressão, Anova e Ancova) até à análise das relações entre as varáveis de modelos mais complexos, como a análise factorial confirmatória e análises de séries temporais.

O diagrama seguinte ilustra a abordagem de base para a realização de uma análise de equações estruturais:
analise-esquacoes-estruturais
A abordagem básica para a realização de uma análise de equações estruturais assenta numa teoria, a partir da qual construímos o modelo a testar. Atendendo ao tipo de variáveis ou fatores envolvidos na teoria, construímos os instrumentos a utilizar na recolha dos dados empíricos. O software de análise estatística ajusta os dados ao modelo especificado e produz os resultados (que incluem as estatísticas gerais de ajustamento do modelo e as estimativas dos parâmetros).

Os inputs para a análise de equações estruturais são geralmente uma matriz de covariância de variáveis, medidas como scores, embora às vezes também se recorra às matrizes de correlações ou às matrizes de covariâncias e médias. O investigador fornece os dados em bruto, enquanto o analista converte estes dados em covariâncias e médias para proceder à análise.

O modelo consiste num conjunto de relações entre as variáveis medidas. Estas relações são então expressas como restrições sobre o conjunto total das relações possíveis.
analise-esquacoes-estruturais-matriz
Os resultados apresentam os índices de ajustamento do modelo, as estimativas dos parâmetros, os erros padrão e as estatísticas de teste para cada parâmetro livre no modelo.

Por fim, confrontamos os resultados obtidos com a teoria (ou a literatura) e nesta interpretação vamos confirmar, ou rejeitar, as hipóteses subjacentes ao modelo, analisar as relações entre as variáveis e avaliar a bondade de ajustamento do modelo proposto com base nos índices da bondade de ajustamento.