Inferência estatística em uma frase

Cassie Kozyrkov Blocked Desbloquear Seguir Seguindo 11 de janeiro

Todos os testes de hipóteses – do STAT101 aos seus exames de doutoramento mais assustadores – resumem-se a uma frase. É o grande insight da década de 1920 que deu origem à maioria das buscas estatísticas que você encontra hoje em dia. Você pode deduzir nossa disciplina, portanto, se quiser entender as estatísticas , graffiti essa sentença ao nível dos olhos e medite nela diariamente.

RA Fisher (1890-1962, britânico) é amplamente considerado como o pai da estatística moderna. Se você quer alguém para culpar pelo conteúdo deste artigo, ele é seu homem.

Bastante preâmbulo! Aqui está o encantamento mágico em si:

"A evidência que coletamos faz nossa hipótese nula parecer ridícula?"

Não estou brincando; isso é tudo que existe para isso. O teste de hipóteses clássicas é isso. Cada. Solteiro. Tempo. Vê-lo despojado de seus dentes e garras pode até parecer uma decepção para aqueles que carregam cicatrizes STAT101. Outros de vocês podem estar lutando para fazer cara ou coroa, então vamos dar uma olhada em um exemplo gentil.

Teste de hipóteses com alienígenas

Você acaba de ser selecionado para a aventura final: procurar planetas pela vida alienígena. Infelizmente, como em todo trabalho dos sonhos, existe … um gerente. Seu gerente malvado lhe deu uma interface de usuário bastante insignificante. Só tem dois botões: SIM e NÃO.

Esta é a totalidade do seu painel de controle. Sim, existe vida alienígena aqui. NÃO, não há vida alienígena aqui. Não há como inserir comentários, comentários ou cobertura.

Em um outro golpe de vilania, seu gerente não lhe deu o orçamento para pesquisar um planeta inteiro. Tudo o que você é capaz de fazer é aterrissar, escolher uma direção, começar a andar até que seu suprimento de oxigênio fique duvidoso, depois voltar e pressionar um desses dois botões. Como você só aterrará em planetas grandes e não terá oxigênio suficiente no tanque para vasculhar cada centímetro de sua superfície, enfrentará incertezas: pode acabar não sabendo qual é a verdadeira resposta.

Etapa 1: qual é a ação padrão?

Cada teste de hipótese começa no mesmo lugar. Um tomador de decisão seleciona uma ação padrão. Esta é a ação que você se compromete em tomar se não examinar nenhuma evidência. Em outras palavras, se você nem pousa neste planeta, você pressionará SIM ou NÃO?

Esta não é uma questão com uma resposta correta. É uma questão de MBA que realmente depende da política de sua empresa de exploração espacial, então vamos passar por este exemplo com os dois padrões possíveis. Se você for como a maioria dos leitores, você preferiria o botão NO como padrão, então vamos primeiro.

Ação padrão: pressione o botão NO.

Passo 2: Qual é a ação alternativa?

… E aqui você esperava que as estatísticas fossem difíceis. A ação alternativa é simplesmente o que você fará se não seguir seu padrão.

Ação alternativa: pressione o botão YES.

Se você ler meu detalhamento de como tudo isso funciona , você se lembrará de que a única maneira de acabar pressionando SIM é se a evidência faz você se sentir estúpido ao pressionar NÃO.

Etapa 3: Qual é a hipótese nula?

Você acabou de pousar em um planeta e está se perguntando: “Se eu soubesse tudo sobre este planeta, quais circunstâncias tornariam o botão NÃO uma escolha feliz?” Se não há vida alienígena neste planeta. Bingo! Essa é a hipótese nula (H0).

H0: Não há vida alienígena neste planeta.

Etapa 4: Qual é a hipótese alternativa?

A hipótese alternativa (H1) é tudo o que é verdade quando o nulo é falso.

H0: Não há vida alienígena neste planeta.

H1: Há vida alienígena neste planeta.

Ta-da! Você tem suas hipóteses configuradas e está pronto para coletar e analisar alguns dados.

Coletar dados

Você é uma alma diligente, então você não passa pelos planetas atingindo o NO. Você aterrissará sua espaçonave, sairá e começará a andar em uma direção miserável por três horas infelizes, depois voltará lentamente. Ao longo de tudo isso, você observou … não há alienígenas.

Estatística: 0 estrangeiros.

O que aprendemos é interessante?

Quando eu ensino isso em uma aula ao vivo, a resposta típica é: “Não havia alienígenas visíveis nesta caminhada de três horas”. Essa é uma resposta sutilmente incorreta, devido à forma como moldamos nossas decisões.

Como você molda sua tomada de decisão é importante. Nem todas as decisões se prestam à abordagem ensinada no STAT101.

Ao nos envolvermos em estatísticas clássicas, concordamos com um contrato legal que diz que apenas a população é interessante para nós. Essa é a superfície de todo o planeta, não essa pequena amostra de uma caminhada de três horas.

Estatística da amostra: 0 aliens na caminhada de 3h.

Parâmetro de população: ?? alienígenas em todo o planeta.

Se estivéssemos fazendo análises , poderíamos estar entusiasmados com este pequeno fato que acabamos de observar, mas não é para isso que estamos aqui. Estamos fazendo estatísticas, então tudo que não é informativo sobre o planeta inteiro é entediante por definição. Não podemos dizer se não vimos alienígenas porque não há nenhum no planeta ou porque eles estão sob aquela outra rocha que ainda não vimos. Não temos como distinguir entre essas duas possibilidades. Então, vamos tentar de novo. É uma resposta de uma palavra. O que aprendemos é interessante?

Nada. Nós aprendemos nada de interessante.

Isso é incrível. Você vê o que aconteceu aqui?

Acabamos de analisar os dados e nós (corretamente!) Não aprendemos nada além disso. Quantas vezes nos deixamos fazer isso? Diga comigo: não aprendi nada e tenho orgulho disso!

Você deve adquirir o hábito de não aprender nada mais frequentemente, porque se você insistir em aprender algo além dos dados toda vez que testar hipóteses, aprenderá algo estúpido.

Quando você está fazendo o tipo de inferência estatística que envolve intervalos de confiança e valores p , aprender nada é uma coisa muito boa.

Isso não é analítica!

Se isso te irritar, respire fundo. Você pode estar pensando como um analista enquanto se arrisca no território de estatísticas. Aqui estão dragões!

O Analytics se preocupa com o que está aqui, enquanto as estatísticas se importam mais com o que não está.

Todos estão qualificados para fazer análises : basta olhar para um conjunto de dados e resumir o que você vê. “Estes são os fatos nesta planilha. Nenhum alienígena observado. ”Você estará aprendendo algo interessante a cada vez em análises, porque o escopo de seu interesse é os dados que estão à sua frente. O Google Analytics tem apenas uma regra de ouro : manter os dados e não ir além disso. Nesse espaço seguro, a excelência é medida pela rapidez com que seus dados estão passando e você não pode errar … exceto se aventurar acidentalmente em estatísticas. Coisas assustadoras se escondem nos espaços fora dos seus dados.

Olhar além da planilha sem se machucar exige uma mentalidade diferente, e é por isso que as estatísticas são mais complicadas. Como chamamos um desses tipos de vaqueiros que andam por aí atirando matemática sem entender a filosofia? Um perigo para si e para os outros.

Coisas sutis importam quando você luta com o desconhecido.

Algumas pessoas parecem pensar que, sempre que analisam dados, o universo lhes deve insights além dos fatos. Se estamos fazendo um salto tipo Ícaro do que sabemos para o que não sabemos, por que esperamos que seja fácil?

Se você insistir em aprender alguma coisa toda vez que testar hipóteses, aprenderá algo estúpido.

Abrace a possibilidade de aprender nada quando você faz estatísticas. (Começando com este artigo?)

O coração pulsante de tudo

Estatística é a ciência de mudar sua mente sob incerteza. Mudaremos de idéia se nos sentirmos ridículos em persistir naquilo que nossa evidência chama de esforço tolo, e é por isso que todo teste de hipótese se resume à mesma pergunta central:

"A evidência que coletamos faz nossa hipótese nula parecer ridícula?"

Para o dever de casa, agora você pode obter a maioria das estatísticas. (Ou você pode continuar lendo, tudo bem também.)

Analisando os dados alienígenas

Não vimos alienígenas em nossa caminhada e nossa hipótese nula é de que não há alienígenas no planeta. Qual é a nossa resposta para a grande questão de teste? A evidência faz nosso nulo parecer ridículo? Como poderia? Nenhum alienígena na amostra é completamente consistente com nenhum alienígena na população.

Agora imagine se em vez de não ver alienígenas em nossa caminhada, vimos esse pequeno cara verde.

Supondo que seja um alien (e não um picles), o que aprendemos? Se eu te disse que eu observei esse alien e ainda estou considerando a possibilidade de que não há vida alienígena neste planeta, você vai me dizer que você observou um idiota.

Essa evidência faz minha hipótese nula parecer ridícula! O que fazemos quando a evidência faz uma hipótese parecer ridícula? Nós não nos apegamos a esse absurdo. Livre-se disso!

Já que sempre projetamos astutamente nossas duas hipóteses de modo que elas abranjam todas as possibilidades, rejeitar uma nos leva a aceitar a outra. Como bons freqüentadores , começamos sem opiniões sobre o planeta. Nós tivemos uma ação favorita, claro, mas você não precisa de opiniões para isso. Os iniciantes parecem se atrapalhar com a diferença entre entender os botões (ações) e entender os planetas (hipóteses), mas você não vai, certo?

Sinta-se ridículo? Rejeitar!

Se nossa evidência nos faz responder "sim" à nossa grande questão de teste, rejeitamos essa hipótese ridícula e fazemos uma conclusão a favor da alternativa. Agora nos sentimos ridículos em realizar a ação padrão, então mudamos para a ação alternativa e pressionamos YES. Então, nós ganhamos conhecimento sobre o planeta como um todo: há vida nisso!

Não se sente ridículo? Aprenda nada.

E quanto ao cenário em que respondemos "não" à nossa pergunta de teste? Na classe STAT101, eles ensinam a escrever um parágrafo complicado quando isso acontece. (“ Nós falhamos em rejeitar a hipótese nula e concluímos que não há evidência estatística suficiente para apoiar a existência de vida alienígena neste planeta.” ) Estou convencido de que o único propósito dessa expressão é forçar os pulsos dos alunos. Sempre permiti que meus alunos de graduação escrevessem assim: não aprendemos nada de interessante.

Parabéns, você não aprendeu nada!

Aprender nada pode parecer uma tragédia. Colocamos todo esse esforço em coletar e analisar nossos dados … e o que conseguimos com isso? Nada?! Antes de nos chorarmos e batermos em nossos peitos, lembre-se de que não estávamos aqui para saber as coisas. Estamos aqui para a tomada de decisões e nosso final é uma escolha sensata de ação, não de conhecimento. Estamos aqui para apertar um botão, droga.

Bem, quando se trata de tomar decisões, este framework é realmente bastante robusto. Nossa ação padrão é a nossa apólice de seguro, que faz com que não seja nada aprender. Isso nos dá um contrato que diz: "Se eu não sei nada, aqui está o que eu vou fazer sobre isso."

Ao entrar neste jogo de inferência, declaramos que ficamos felizes em tomar nossa ação padrão sob ignorância … se esse não for o caso, não devemos estar nas estatísticas. Nada disso faz sentido sem uma ação padrão.

Nossa ação padrão foi pressionar o botão NO, então é isso que fazemos quando não rejeitamos a hipótese nula. Nós tomamos a ação que ficamos felizes porque não há razão para mudar de idéia. É a ação correta? Me bate! Mas fizemos um esforço honesto para nos convencermos disso e agora estamos fazendo o que planejamos fazer com uma consciência limpa.

Deixar de rejeitar a hipótese nula certamente não significa que acreditemos que não haja alienígenas aqui. Pelo que sabemos, eles estão saindo um pouco além da próxima formação rochosa. Nós seríamos tolos para concluir que eles não estão aqui só porque não os encontramos. Se eu passar 5 minutos procurando as minhas chaves sem sucesso, isso não significa que elas não estão no meu apartamento. Isso significa que eu não sei onde eles estão. Há uma diferença. (Seu senso de ânimo formigando desconfortavelmente? Então leia isto .)

Não há razão para mudar de idéia? Continue com a ação padrão conforme planejado. É a ação correta? ¯ _ (?) _ / ¯ Bem-vindo à incerteza.

Resumindo: o jogo do teste de hipóteses tem tudo a ver com determinar se as evidências que coletamos fazem nossa hipótese nula parecer ridícula. Tudo depende de como nos sentimos sobre mudar nossas mentes à luz das evidências.

Para ver o que seria diferente em um universo paralelo em que a ação padrão é SIM em vez de NÃO, leia aqui . (Dica: tudo muda!)

Cassie Kozyrkov – Hacker Noon
Leia a escrita de Cassie Kozyrkov em Hacker Noon. Chief Decision Intelligence Engineer, Google. ?? Estatísticas, ML / AI, dados… hackernoon.com