Validade e fiabilidade na investigação: Guia e exemplos para garantir o rigor científico

Continua a acompanhar os nossos artigos e não percas nenhuma das novidades que partilhamos no blog. Vais encontrar recursos úteis e sugestões práticas para os teus trabalhos académicos.

Se tiveres alguma dúvida, preenche o formulário e entraremos em contacto contigo o mais rapidamente possível.

Preencha o formulário, está a um passo da aprovação

A validade e a fiabilidade são os dois pilares que conferem rigor a qualquer investigação, pois constituem uma espécie de selo de qualidade do método científico, bem como os critérios que separam uma mera opinião de uma evidência sólida.

Quer estejas a conceber o teu primeiro questionário, a analisar dados para redigir um projeto de mestrado ou a avaliar estudos publicados, neste artigo explicamos o que estes termos significam realmente e como se aplicam em diferentes metodologias, com exemplos para que os possas implementar.

O que é a validade?

A validade é um dos conceitos mais importantes na investigação científica. Refere-se a se uma ferramenta, método ou estudo mede realmente o que pretende medir, e se as suas conclusões são credíveis e aplicáveis.

Por outras palavras, não basta que um teste ou experimento produza resultados consistentes, pois o elemento fundamental é que esses resultados reflitam a realidade do fenómeno que queremos estudar, sem distorções nem erros sistemáticos.

Por exemplo, se criares um questionário para medir a ansiedade, mas que na realidade mede o stress geral, o teu instrumento não é válido, mesmo que produza sempre a mesma pontuação.

Tipos de validade

Existem vários tipos de validade, mas os três mais essenciais são os seguintes:

Validade de construto: mede se o instrumento capta adequadamente o conceito teórico que queremos avaliar.
Validade de conteúdo: avalia se o teste cobre de forma adequada e representativa todos os aspetos do tema.
Validade de critério: verifica se os resultados se relacionam com um padrão externo conhecido.

Exemplo de validade na investigação

Para este exemplo, partimos do pressuposto de que estás a realizar um estudo sobre o nível de stress em estudantes universitários durante a época de exames.

Crias um questionário com 20 perguntas para medir o stress académico. Para que o teu instrumento tenha validade, deve medir realmente o stress académico e não outra coisa semelhante.

Validade de construto (a mais importante neste caso): suponhamos que incluis perguntas como:

Sentes-te nervoso antes de um exame?
Tens dificuldade em concentrar-te por causa da preocupação com as notas?

Se testares o questionário com especialistas em psicologia e estes confirmarem que as perguntas captam bem o conceito teórico de stress académico, então o instrumento possui boa validade de construto.

Validade de conteúdo: verificas se as 20 perguntas cobrem todos os aspetos-chave do stress académico segundo a literatura:

Sintomas emocionais.
Sintomas físicos.
Sintomas cognitivos.
Sintomas comportamentais.

Se faltarem perguntas sobre sintomas físicos (como dores de cabeça ou insónia por causa dos exames) e te concentrares apenas na dimensão emocional, o instrumento não representa adequadamente o construto completo e a validade de conteúdo fica comprometida.

Validade de critério: comparas as pontuações do teu questionário com um padrão externo conhecido, por exemplo, com o nível de cortisol (hormona do stress) medido na saliva dos mesmos estudantes, ou com outro teste já validado como o Perceived Stress Scale (PSS).

Se existir uma correlação elevada (os que obtêm pontuação alta no teu questionário também apresentam cortisol elevado ou PSS elevado), o teu instrumento tem boa validade de critério.

O que é a fiabilidade?

A fiabilidade é o grau em que um instrumento, método ou procedimento de medição produz resultados consistentes, estáveis e repetíveis nas mesmas condições.

Ou seja, se aplicares o mesmo teste ou questionário várias vezes à mesma pessoa ou grupo, os resultados deverão ser muito semelhantes.

A fiabilidade não garante que estejas a medir o que é correto (isso é a validade), mas assegura que as medições são precisas e isentas de grandes erros aleatórios.

Como salienta Lee Cronbach (1951), a fiabilidade é avaliada habitualmente através do coeficiente alfa de Cronbach, que mede a consistência interna dos itens de um instrumento: valores acima de 0,70 são geralmente considerados aceitáveis nas fases iniciais da investigação.

Contudo, autores como Nunnally (1978) recomendam 0,80 ou mais para estudos básicos e até 0,90-0,95 quando as decisões são críticas.

Exemplo de fiabilidade na investigação

Apresentamos um exemplo de fiabilidade por consistência interna, que é a mais utilizada nos projetos de mestrado:

Exemplo clássico de escala de satisfação profissional

Numa dissertação sobre “Satisfação profissional em docentes universitários”, utiliza-se um questionário de 20 itens em escala de Likert (1-5).

Após a aplicação a 200 docentes, calcula-se o Alfa de Cronbach = 0,89 (excelente).

Interpretação: os itens são consistentes entre si → elevada fiabilidade interna. Se o alfa fosse 0,62, indicaria problemas (baixa fiabilidade) e seria necessário eliminar os itens problemáticos.

Exemplo em psicologia/educação

Adaptação do Inventário de Ansiedade de Beck (BAI) em população adolescente latino-americana.

No estudo piloto com 150 participantes → Alfa de Cronbach global = 0,91.

Por dimensões: Ansiedade somática = 0,87, Ansiedade cognitiva = 0,84.

→ O instrumento é altamente fiável para medir a ansiedade neste grupo.

Métodos e coeficientes para medir a fiabilidade

A fiabilidade mede-se através de vários métodos que avaliam diferentes aspetos da consistência. Os mais comuns e amplamente aceites em psicometria e investigação são:

Teste-reteste (estabilidade temporal)

É um método no qual se aplica o mesmo instrumento duas vezes ao mesmo grupo de pessoas com um intervalo de tempo (semanas ou meses) e se calcula a correlação entre os dois conjuntos de pontuações.

Geralmente utiliza-se o coeficiente de correlação de Pearson ou o coeficiente de correlação intraclasse (ICC), sendo que um valor ≥ 0,80 indica boa estabilidade. É ideal para traços estáveis como a personalidade ou as atitudes.

Formas paralelas ou equivalentes

Com este método criam-se duas versões equivalentes do instrumento (mesmo conteúdo e dificuldade, mas itens diferentes) e aplicam-se simultaneamente ou com intervalo. A fiabilidade estima-se com a correlação entre as pontuações de ambas as formas, medindo tanto a estabilidade como a equivalência.

Consistência interna

Este método avalia se os itens do instrumento medem o mesmo construto de forma coerente (requer apenas uma aplicação). Os coeficientes principais são:

Coeficiente alfa de Cronbach (o mais utilizado)

Mede a consistência interna calculando a média de todas as correlações entre os itens.

Fórmula base: α = (k / (k-1)) × (1 – (Σ variâncias itens / variância total))

Onde k é o número de itens. Valores ≥ 0,70 são aceitáveis, ≥ 0,80 bons e ≥ 0,90 excelentes (embora possa ser sobrestimado com muitos itens).

KR-20 e KR-21 (Kuder-Richardson)

Versões para itens dicotómicos (sim/não ou verdadeiro/falso), visto que o KR-20 é equivalente ao alfa de Cronbach para respostas binárias.

Inter-avaliadores

Mede o grau de concordância entre diferentes observadores ou avaliadores, por exemplo, na observação comportamental. Utiliza-se o coeficiente kappa de Cohen (para dados categóricos) ou o ICC (para dados contínuos), sendo que valores > 0,75 indicam concordância excelente.

Importância da validade e da fiabilidade numa investigação

A validade e a fiabilidade são fundamentais numa investigação (sobretudo quantitativa) porque determinam se os resultados são realmente úteis para tomar decisões e gerar conhecimento.

Por exemplo, a validade assegura que o instrumento mede exatamente o que se pretende estudar, enquanto a fiabilidade garante que os resultados são estáveis e consistentes.

Assim, em conjunto, a validade e a fiabilidade contribuem para que os dados sejam precisos, credíveis e úteis, evitando erros que possam afetar decisões académicas, sociais ou profissionais.

Diferença entre validade e fiabilidade

Na tabela seguinte podes consultar as diferenças entre ambos os critérios de investigação:

Aspeto	Fiabilidade	Validade
Definição	Mede se um instrumento produz resultados consistentes, estáveis e repetíveis nas mesmas condições.	Mede se o instrumento avalia realmente o que pretende medir e se as conclusões são credíveis e aplicáveis.
Foco principal	Consistência e ausência de erros aleatórios (reprodutibilidade).	Precisão e relevância do construto (estamos a medir o que é correto?).
Pergunta-chave	Produz sempre resultados semelhantes quando nada mudou?	Mede realmente o conceito que queremos estudar?
Exemplo simples	Um termómetro que marca sempre 37 °C na mesma pessoa saudável → alta fiabilidade.	Um termómetro que marca 37 °C mas que na realidade mede a temperatura ambiente → alta fiabilidade, mas baixa validade.
Requisito	É condição necessária para a validade (sem fiabilidade não pode haver validade).	É o objetivo final; pode existir fiabilidade sem validade, mas não o contrário.
Métodos de medição	Teste-reteste, formas paralelas, consistência interna (alfa de Cronbach), concordância inter-avaliadores.	Validade de construto, de conteúdo, de critério, convergente/divergente, etc.
Consequência se falha	Os dados variam por acaso → resultados instáveis e imprevisíveis.	Os resultados parecem consistentes mas medem algo errado → conclusões incorretas ou inúteis.
Resumo	Garante que o instrumento é estável e reprodutível.	Garante que o instrumento é preciso e relevante para os objetivos da investigação.

Validade e fiabilidade para garantir a qualidade da tua investigação

Ao combinar a fiabilidade e a validade na investigação através de procedimentos como o juízo de especialistas, a análise fatorial, o coeficiente alfa de Cronbach ou ómega de McDonald, obtém-se um instrumento robusto que não só produz resultados coerentes, como também pertinentes e próximos da realidade estudada.

Se necessitares de apoio, no Gabinete de Estudios contamos com uma equipa de docentes e especialistas universitários especializados em projetos de mestrado, trabalhos finais de curso, teses de doutoramento, análise com SPSS, validação de instrumentos, redação académica e muito mais.

Perguntas frequentes

Todos os instrumentos precisam de critérios de validade e fiabilidade?

Sim. De facto, qualquer instrumento de investigação deve demonstrar validade (que mede o que pretende medir) e fiabilidade (que mede de forma consistente). Sem estes critérios, os resultados não são fiáveis nem científicos.

Que fatores afetam a fiabilidade e a validade?

São afetadas pela clareza das perguntas, pela definição adequada do construto que se pretende medir, pelo nível de compreensão dos participantes, pelas condições de aplicação (ambiente, tempo, instruções), pelo viés do investigador, pela qualidade da escala de resposta e pela consistência na forma de administrar o instrumento.

Como se mede a fiabilidade de um questionário?

A fiabilidade de um questionário mede-se avaliando a consistência dos seus resultados através de métodos estatísticos como o alfa de Cronbach (consistência interna), o teste-reteste (estabilidade no tempo), a fiabilidade inter-avaliadores (concordância entre avaliadores) e a divisão por metades.