Como terminamos em 3º e ainda ganhamos uma competição de ciência de dados

Tivemos muito trabalho a fazer – mesmo depois da publicação dos resultados finais.

Julio Cezar Silva Blocked Desbloquear Seguir Seguindo 2 de julho made with ? ? by Luciano Infanti Ouvir Unboxing Data Science no Spotify

Foi um duo de primeira vez contra cientistas veteranos em todo o mundo, então você pode imaginar como isso termina.

Há alguns meses, éramos apenas dois alunos construindo conhecimento em Data Science e nos esforçando para entrar no campo profissionalmente. Na época, Victor era estagiário de pesquisa de dados na IBM Research e eu era analista de arquitetura de software na Accenture. Nosso objetivo em comum nos levou a uma busca de competição que era cada vez mais frustrante, uma vez que sempre se resumia a lugares onde as vitórias são puramente técnicas, e coisas como sondagens de classificação se tornam comuns.

A oportunidade de testar nossas habilidades além da técnica pura foi encontrada apenas um mês depois: o Concurso de Ciência de Dados EY NextWave . Abordou os problemas de mobilidade urbana em Atlanta, desafiando os participantes a prever se as trajetórias terminariam no centro da cidade, com base em dados de geolocalização.

E este foi diferente.

Não foi mais um desafio apenas de habilidade difícil, já que a construção de um modelo de pontuação superior foi apenas metade da batalha: os principais cientistas da Rank tiveram que apresentar seus métodos e antecedentes de pesquisa a um quadro de juízes de posições mais altas na EY. O uso de dados externos, a robustez da EDA e abordagens orientadas para problemas estavam entre os principais critérios.

Aqui nós damos um cronograma de estratégia sobre como, concentrando-nos na solução do problema, transformamos nosso modelo de terceiro lugar no projeto vencedor. Compreenda-nos completamente seguindo o código completo no GitHub ao lado.