Como aprendi a ciência dos dados da maneira mais difícil em 2018

Começando na ciência de dados sem um diploma de ciência

Aileen Blocked Unblock Seguir Seguindo 1 de janeiro

Como você começa na ciência de dados, quando não tem um diploma de ciências? Ao explorar as ofertas de emprego, quase todas elas listavam a educação em matemática, estatística, ciência da computação ou, pelo menos, um campo quantitativo como um requisito. E eu não tenho isso.

Posso quebrar o status quo e me juntar a essa comunidade que eu pretendo estar? Eu decidi me ensinar da maneira mais difícil.

Uma pergunta foi intrigante para mim. Quanto posso aprender ao longo de um período de seis meses se estou me esforçando até o limite?

A história de Scott Young foi uma inspiração para mim. Ele aprendeu sozinho um currículo de ciência da computação de quatro anos no MIT OCW em um ano, trabalhando nos assuntos de 35 a 60 horas por semana. Você nunca sabe seus limites até que você experimente. Às vezes, é até divertido fazer coisas que parecem impossíveis.

Em maio deste ano, iniciei minha própria versão do desafio do MIT. O primeiro curso que fiz foi o Cálculo Único Variável no MIT OCW. Eu logo redescobri meu antigo amor pela matemática e me absorvi nessas palestras online. O meu favorito foi a aula de Álgebra Linear de Gilbert Strang. Por algumas semanas, eu acordava com suas palestras engraçadas e sentia vontade de estar com um velho amigo.

Durante o período de estudo intensivo, escolhi um novo assunto como o foco da semana e trabalhei nele o maior número possível de horas por dia. Para ser mais eficaz no meu aprendizado, Tentei diferentes técnicas de aprendizado: estabelecendo horas dedicadas de estudo com intervalos, aprendendo ativamente através de exercícios e anotações, repetindo ensaios para criar memórias de longo prazo, combinando materiais visuais e auditivos e ensinando o conceito a um amigo. Essas técnicas me ajudaram a atingir uma meta de aprendizado ambiciosa a cada dia.

O começo foi o mais difícil, mas a curva de aprendizagem íngreme pode ser muito gratificante. Em meados de junho, eu quase assisti todas as palestras de matemática que eu poderia encontrar no MIT OCW. Estabelecer uma base em matemática é apenas o primeiro passo. Mas é um grande avanço.

Um desafio quando eu comecei foi – você não sabe o que você não sabe.

Quando me deparei com o programa de verão Estatísticas avançadas e mineração de dados na Espanha, não tinha ideia de como selecionar os cursos. Devo fazer redes bayesianas ou estatísticas bayesianas? Os nomes dos cursos pareciam todos estranhos para mim. No entanto, qualquer que fosse o curso, eu simplesmente me joguei lá fora, para estar naquele ambiente de aprendizado.

A escolha de estar cercado por pessoas que têm mais experiência do que eu – Isso levou a mudanças reais. Eu conheci um grupo diversificado de pessoas de telecomunicações, ciência da computação, finanças, matemática – que todos compartilham uma paixão pelo aprendizado de máquina. Eu aprendi tanto com eles quanto com os cursos.

Depois de obter algumas práticas práticas sobre programação com Python, eu estava pronto para continuar com o curso de aprendizado de máquina de Andrew Ng. Suas palestras sobre aprendizado de máquina e aprendizado profundo são tão boas que quase me viciei em assisti-las. Os exercícios fornecidos em seus cursos foram tremendamente úteis para testar minha compreensão das teorias e implementar os algoritmos em códigos.

Muitos outros recursos de ciência de dados e aprendizado de máquina também foram uma grande ajuda: DataCamp, Introdução ao Aprendizado Estatístico por Trevor Hastie e Rob Tibshirani, Aprendendo com Dados por Yaser S. Abu-Mostafa e uma série de palestras do MIT OCW – Inteligência Artificial, Introdução Pensamento Computacional e Ciência de Dados e Introdução ao Algoritmo.

Eu descobri que, quando se trata de estudar aprendizado de máquina, é quase inevitável que você encontre alguns conteúdos que você não entende. Tomei o conselho do manual "Reading Mathematics" da Cornell University – pondo alguma coisa de lado por algum tempo quando você não entende imediatamente:

“Você pode freqüentemente (talvez geralmente) achar que quando você retornar a algo que você deixou meio entendido, ficará claro à luz das outras coisas que você estudou, mesmo que as outras coisas sejam obscuras.”

Então eu pensei que deveria me manter envolvido com uma comunidade de ciência de dados. Então me mudei para Berlim. Aqui eu me juntei a grupos semanais de projetos de ciência de dados, participei de encontros organizados por uma variedade de empresas e me ofereci para conferências de aprendizado de máquina.

Eu recomendo aplicar em conferências como voluntário, especialmente para aqueles com um orçamento de aprendizado limitado. Em troca, tive a incrível oportunidade de me reunir com cientistas de dados, fazer perguntas e conversar com empresas que estão contratando. Sinto-me feliz por ter encontrado mentores que têm compartilhado seus valiosos conselhos comigo ao longo do tempo. Esta é realmente uma comunidade incrível para se estar.

Então eu vim para Kaggle. Eu tenho adiado a realização de competições em Kaggle porque eu pensei que não poderia classificar bem. Eu achei muito melhor ver o Kaggle como uma plataforma de aprendizado do que uma plataforma de competição. Observar como outras pessoas lidam com projetos de ciência de dados no Kaggle tem sido uma das maneiras mais eficazes de aprender.

Olhando para trás, em algum momento, fiquei com medo. Na minha primeira conferência acadêmica, achei difícil justificar minha razão como graduado em administração. Achei difícil estar sentado em uma sala onde eu não entendia muito dos tópicos apresentados.

Mas, e isso é um grande, mas aqui, as coisas melhoraram, muito melhor e eu quase esqueci onde comecei. Eu quase me esqueci disso há meio ano, não fazia aulas de matemática ou ciências há 10 anos e hoje estou resolvendo diferentes problemas de ciência de dados com conjuntos de dados públicos. Até o final de 2018, estou me preparando para entrevistas com empresas para as quais eu não teria sonhado em ser um candidato a ciência de dados 6 meses atrás.

Depois de embarcar nesta jornada, tudo ao seu redor parece ter mudado. Você começa a olhar para cada problema de uma nova perspectiva e se pergunta: seria o aprendizado de máquina uma solução?

Viva o medo. Continue indo.