Uma lista de leitura não técnica para dados científicos

Livros que farão de você um cientista de dados melhor sem se aprofundar nos detalhes técnicos

Will Koehrsen Blocked Desbloquear Seguir Seguindo 10 de janeiro

Ao contrário do que alguns cientistas de dados podem gostar de acreditar, nunca podemos reduzir o mundo a meros números e algoritmos. No fim das contas, as decisões são tomadas por humanos, e ser um cientista de dados eficaz significa entender tanto pessoas quanto dados.

Considere o seguinte exemplo da vida real:

Quando a OPower, uma empresa de software, queria que as pessoas usassem menos energia , eles forneceram aos clientes várias estatísticas sobre seu uso e custo de eletricidade. No entanto, os dados por si só não foram suficientes para levar as pessoas a mudar. Além disso, a OPower precisava tirar proveito da ciência comportamental, ou seja, estudos mostrando que as pessoas eram levadas a reduzir a energia quando recebiam emoticons sorridentes em suas contas, mostrando como eles se comparam aos vizinhos!

A simples intervenção de colocar ? nas contas de luz das pessoas quando eles usaram menos que os vizinhos, e uma cara quando poderiam fazer melhor acabou reduzindo o consumo de eletricidade em 2–3%, no processo economizando milhões de dólares e evitando emissões de milhões de libras de CO2! Para um cientista de dados, isso pode ser um choque – você quer dizer que as pessoas não respondem a dados puros! – mas isso não foi surpresa para o diretor científico da OPower , Robert Cialdini, um ex-professor de psicologia que escreveu um livro sobre o ser humano. comportamento. O takeaway é que você pode ter qualquer dado que quiser, mas ainda precisa entender como os humanos trabalham para efetuar uma mudança real.

A visualização mais eficaz não é um gráfico de barras, é um rosto sorridente.

Em nosso trabalho diário e na educação formal como cientistas de dados, é difícil ter um vislumbre do funcionamento dos seres humanos ou dar um passo para trás e pensar sobre as implicações sociais de nosso trabalho. Portanto, é essencial ler não apenas artigos técnicos e livros didáticos, mas também extrair trabalhos que analisam como as pessoas fazem escolhas e como os dados podem ser usados para melhorar essas escolhas.

Neste artigo, vou destacar 6 livros que não são técnicos – no sentido de que eles não se aprofundam em matemática e algoritmos -, mas leituras críticas para cientistas de dados. Esses livros são necessários para qualquer um que queira realizar o objetivo da ciência de dados: possibilitar melhores decisões do mundo real por meio de dados.

Os 6 livros estão listados aqui com breves revisões e tópicos a seguir:

  1. O sinal e o ruído: Por que tantas previsões falham – mas algumas não são de Nate Silver
  2. Armas da destruição da matemática: como os grandes dados aumentam a desigualdade e ameaçam a democracia por Cathy O'Neill
  3. Algoritmos para viver por: A Ciência da Computação das Decisões Humanas por Brian Christian e Tom Griffiths e Como Não Estar Errado: O Poder do Pensamento Matemático por Jordan Ellenberg
  4. Pensando, Rápido e Lento por Daniel Kahneman
  5. (O cavalo negro ) O Cisne Negro: O Impacto do Altamente Improvável por Nassim Nicholas Taleb