Domesticar Descobertas Falsas com Bayes Empíricos

Como pescar com segurança em um mar de barulho

Jannes Klaas Blocked Desbloquear Seguir Seguindo 12 de janeiro Cuidado com as falsas descobertas quando se pesca em um mar de barulho

Cientista de dados de hoje tem uma enorme quantidade de dados à sua disposição. Mas eles também enfrentam um novo problema: com tantos recursos para escolher, como evitamos falsas descobertas?

Os valores de p se prestam a falsas descobertas. Supondo que não haja efeito, a execução de 100 testes independentes de valor-p resultará em 5 resultados positivos em média. Ser enganado 5 vezes é gerenciável, mas se corremos milhões de testes de hipóteses, a situação rapidamente se torna insuportável.

Precisamos de um método que nos permita controlar a quantidade de falsos positivos que encontramos. Ele deve escalar com o número de hipóteses que corremos e nos permitir estar confiantes sobre nossas descobertas como um todo.

Texto original em inglês.