Se as reivindicações idênticas são baseadas em dados idênticos, como pode uma reivindicação ser uma porcaria e outra não?

Charles Lambdin em Columbus 'Egg Seguir Mai 31 · 5 min ler

Era uma vez havia dois cientistas. Eles eram gêmeos idênticos. Ninguém poderia distingui-los. Um dia você se depara com eles em uma conferência, na sala de pôsteres. Lá estão eles, próximos um do outro, pelos respectivos cartazes. Você leu os dois. Eles fazem exatamente as mesmas reivindicações e são suportados pelos mesmos dados. Eles são os mesmos em todos os aspectos … exceto por uma coisa pequena.

O gêmeo idêntico A coletou seus dados depois de formular sua hipótese. O gêmeo idêntico B coletou seus dados e então formulou sua hipótese. Os gêmeos têm as mesmas hipóteses, os mesmos conjuntos de dados e afirmam que os dados mostram os mesmos resultados. Mas eles não são os mesmos. A reivindicação do gêmeo A é forte; B de gêmeo não é. Como isso pode ser?

A diferença é que o Gêmeo A tratou sua hipótese como uma previsão . O gêmeo B, por outro lado, olhou primeiro os dados. Sua hipótese era uma acomodação . Não importa realmente que os dados e a formulação das hipóteses sejam os mesmos – as relações entre os dados e as hipóteses são muito diferentes.

A previsão é geralmente considerada mais científica do que a acomodação. Quando Edmond Halley formulou a hipótese de que os cometas de 1531, 1607 e 1682 eram de fato o mesmo cometa, as pessoas realmente não ficaram tão impressionadas. Não foi até que ele previu com sucesso o retorno do cometa em 1758 que ele foi levado a sério (Lipton, 2005). Isso levanta a questão: por que a predição é mais científica que a acomodação? Bem, vamos olhar novamente para a diferença entre os nossos gêmeos.

Twin A fez sua hipótese primeiro (talvez baseada em dados anteriores), e então projetou uma experiência para testá-la. Isso forneceu um teste que sua previsão poderia falhar. Além disso, o experimento permitiria que ele controlasse fatores externos que pudessem impactar os dados resultantes, o que poderia “confundir” o teste da hipótese em questão.

O gêmeo B recolheu seus dados primeiro e depois customizou uma hipótese para explicá-la. Isso é chamado de hipótese ad hoc . Aqui está um exemplo clássico: Os dados entram nesse conflito com a visão de que os cinco planetas conhecidos têm órbitas circulares. Em vez de abandonar essa visão, você coloca a existência de epiciclos para salvar o modelo. Os dados (que as distâncias dos planetas conhecidos mudam em relação à Terra) não são, portanto, um teste para sua nova hipótese “epiciclo”. Longe disso – sua hipótese acomoda os dados. Sua hipótese é uma tentativa de explicar os dados inconvenientes e intrometidos.

A propósito, é por isso que alguns cientistas se referem pejorativamente à hipótese ad hoc de “adicionar epiciclos”. Para ilustrar melhor, suponhamos que o gêmeo A e o gêmeo B não se conheçam. Eles foram separados no nascimento e nunca se encontraram. Eles, então, simplesmente passam por cima um do outro na conferência e aprendem o trabalho um do outro. Quais devem ser as reações deles? (Lipton, 2005)

Eu argumentaria que o Gêmeo B deveria aumentar sua confiança, mas que o Gêmeo A não deveria. O gêmeo B não tinha como saber se seus dados continham confusão e pouca razão para supor que não continham. Um "confundir" é uma variável, diferente da hipótese, que foi desconsiderada e não controlada, mas que, no entanto, pode ser a explicação real para o padrão observado nos dados . É mais fácil ilustrar com exemplos. Assim…

Exemplo 1: Após revisar suas descobertas, os pesquisadores concluíram que as crianças que dormem com suas luzes acesas têm maior probabilidade de ficarem míopes. Exemplo 2: Um estudo antigo descobriu que pessoas com amianto em sua água potável experimentam um aumento na taxa de câncer de pulmão. Os pesquisadores assumiram que o consumo de amianto também pode causar câncer de pulmão. Exemplo 3: Pesquisas descobriram que bebedores moderados são mais saudáveis que abstêmios, levando a pesquisadores argumentando que o consumo moderado pode trazer benefícios para a saúde.

Pausa. Você consegue pensar em algum dos confusos presentes? No primeiro, os pais míopes são mais propensos a ter filhos míopes. Eles também são mais propensos a deixar as luzes acesas. No segundo, as pessoas pobres são mais propensas a ter amianto na água e também são mais propensas a fumar. (Isto é como o antigo exemplo de “sorvete causa crime” – é o clima quente.) O terceiro exemplo tem sido ultimamente ultimamente. Uma pesquisa comparando bebedores moderados com abstêmios é confundida com pessoas que estão livres para beber porque são saudáveis contra aquelas que não podem beber devido a problemas de saúde existentes . (Pesquisa mais recente abordando tais confusões é descobrir que nenhuma quantidade de álcool é sempre saudável.)

A questão central tem a ver com o que faz uma boa inferência causal. Curiosamente, embora agora seja comum a sabedoria de que "correlação não implica causalidade", esta é realmente uma afirmação falsa! Correlação é um método de análise , não de desenho experimental. Para a inferência causal, o que importa é o design, seja ele experimental ou passivo-observacional, e não se os resultados são analisados com uma ANOVA ou uma regressão (que são essencialmente a mesma coisa de qualquer maneira).

Um verdadeiro experimento requer três coisas: 1) designação aleatória de sujeitos para níveis; 2) manipulação dos níveis de pelo menos uma variável independente (se você não manipular uma variável você não pode atribuir aleatoriamente indivíduos a níveis); e, 3) controle de variáveis estranhas (Tabachnick & Fidell, 2019). Isso ajuda você a controlar as confusões.

Você pode realizar um experimento verdadeiro e analisar os resultados com uma regressão (com correlações). Não é a correlação que é o problema. Agora, voltando aos nossos gêmeos, este é o principal problema com o trabalho de B: Se sua hipótese é em si mesma uma acomodação, você não está controlando os confusos. Você tem poucas razões para assumir que não está apenas narrando, tecendo um bom conto e se enganando no processo. Em geral, os dados que geraram uma hipótese também não podem ser considerados como um teste para essa hipótese.

Referências

Lipton, P. (2005). Testando hipóteses: Previsão e preconceito. Science, vol. 307, 219-221.

Tabachnick, B. & Fidell, L. (2019). Usando estatísticas multivariadas. NY: Pearson.

Texto original em inglês.