Qual função de dados devo preencher primeiro em uma startup?

Pawel Koperek Blocked Desbloquear Seguir Seguindo 3 de janeiro Foto por JD Mason em Unsplash

Recentemente, tive o prazer de falar com alguns fundadores de startups. Todos reconheceram a necessidade de trazer alguém que possa ajudar a aproveitar os dados que coletam ou têm planos para coletar. O primeiro instinto nesta situação é trazer um cientista de dados experiente, que, ao entrar diretamente no produto, pode fornecer análises profundas e criteriosas. Infelizmente, na maioria dos casos, não é assim tão fácil: essa pessoa precisa de tempo para aprender . Eles precisam aprender:

  • a empresa: qual é a sua estrutura, missão, como ganha dinheiro, quais são seus lados fortes e fracos, etc.
  • o produto: entenda o roteiro, planeje novos recursos, como ele contribui para a maior visão da empresa, o que já é conhecido, quais são as incógnitas, quais métricas devem ser usadas para medir o desenvolvimento do produto e quais são as alavancas que a equipe pode use para movê-los
  • os dados: que dados são coletados e quando, entendem o que os dados realmente significam
  • a plataforma de dados: como os dados são coletados , como acessar os dados, como os dados são processados, como se pode começar a coletar novos pontos de dados, alterar a forma como os processos existentes funcionam ou remover os existentes

Foto por rawpixel no Unsplash

Se você considera uma empresa desenvolvida, já deve haver alguns materiais que ajudariam a trazer uma nova pessoa à tona: documentação de conjuntos de dados existentes, processos de ETL, tecnologias usadas, um manual de boas práticas ou apenas um conjunto de notas deixadas por alguém que estava trabalhando em um projeto até agora. Em uma startup, a situação normalmente é drasticamente diferente: muito poucas pessoas sabem exatamente quais dados são coletados (se houver), ninguém tem uma compreensão holística, de ponta a ponta, dos fluxos de dados e como os números que eles produzem devem ser interpretados. a plataforma de dados pode não existir.

Neste ponto, começa a ficar claro que uma empresa precisa reconsiderar se um cientista de dados é o papel que deve ser preenchido neste momento. Para torná-lo eficiente e bem-sucedido, há alguns ingredientes-chave que precisam ser fornecidos: dados limpos e uma plataforma de dados .

Vamos olhar para este problema de um ângulo diferente. Para muitas pessoas, há papéis seguintes na análise moderna:

  • Engenheiro de Dados – modela e define conjuntos de dados, grava processos ETL escaláveis e código de coleta de dados, assegura que os dados estejam limpos e bem estruturados – em geral, garante que os dados estejam sendo coletados de maneira confiável e robusta
  • Analista de dados – cria relatórios, painéis, responde a perguntas de negócios – fornece uma imagem clara do que está acontecendo e ajuda a impulsionar a estratégia de negócios
  • Data Scientist – aplica estatística avançada a dados para descobrir novas percepções, constrói modelos de Aprendizado de Máquina, descobre maneiras de otimizar processos de negócios usando dados – aproveita o poder dos dados para levar a empresa ao próximo nível

Na realidade, as habilidades de ciência de dados (ou análise) são mais de um espectro. Cada função de dados tem, por exemplo, um componente de compreensão do negócio e um grau de habilidades de codificação. Para um DE, boas habilidades de codificação são essenciais. Eles precisam deles para criar processos ETL robustos e confiáveis. Por outro lado, seu entendimento de negócios não precisa ser muito minucioso. Eles têm que usar a mesma terminologia de acordo com a nomenclatura da empresa, mas não se deve esperar que eles conduzam a estratégia pelos próximos 3 ou 5 anos. Para um analista de dados, o conhecimento do negócio é fundamental. Eles precisam filtrar o sinal do ruído e colocá-lo no contexto das tendências gerais da empresa. Suas habilidades de codificação devem permitir que eles acessem e usem os dados de forma eficaz, mas não precisam ser de primeira linha.

A maioria dos problemas iniciais de análise nas startups está relacionada à coleta de dados, limpeza e garantia de que os dados sejam interpretados da maneira correta. A coleta de dados pode parecer diferente em todos os cenários: pode ser tão simples quanto conectar o Google Analytics ou o Mixpanel, criar uma extração de um banco de dados existente, pesquisar dados de APIs remotas ou sites de extração, coletando dados diretamente de um grande número de dispositivos de usuário. As questões comerciais são inicialmente relativamente simples: quantos usuários estão usando o produto, qual é o recurso mais popular, qual segmento de usuários está retornando ao produto etc.

Qual papel deve ser preenchido primeiro em uma startup? A resposta à nossa pergunta, portanto, depende muito do contexto:

  • o mix de habilidades que já estão presentes na equipe (por exemplo, você pode ter engenheiros de software capazes de trabalhar em uma versão inicial de uma plataforma de dados).
  • o que e quantos dados devem ser coletados
  • Quais são as perguntas que ajudariam a levar o negócio adiante?

Minha regra de polegar é a seguinte:

  • se a ideia de negócio depende de uma implementação de um modelo de ML – pare de ler agora e comece a contratar o melhor talento de Data Science possível
  • se houver alguém que possa criar a versão inicial de uma plataforma de dados ou que os dados possam ser extraídos de maneira fácil (por exemplo, por meio de um aplicativo SaaS ou um extrato de dados simples), contrate um analista de dados experiente que ajude a organizá-lo e criar um imagem clara do estado do negócio. Aumente a equipe de acordo com as necessidades de lá.
  • se não há ninguém, quem poderia preencher a função de Engenheiro de Dados ou há muitas fontes de dados que precisam ser acessadas com frequência – primeiro procure um Engenheiro de Dados, que também poderia ajudar a responder as primeiras perguntas mais simples. Quando a fundação for construída, aumente a equipe e traga um analista de dados ou um cientista de dados para levá-lo ao próximo nível.