Os cientistas de dados devem saber como escrever código de produção?

Bem, aqui está a minha resposta …

Admond Lee Blocked Unblock Seguir Seguindo 4 de janeiro

Bem-vindo a 2019 e este é o meu primeiro artigo sobre Medium neste novo ano.

Aqui está a parte brega (sinta-se livre para pular, se necessário) – 2018 é o ano de virada na minha vida , e ter escrito sobre o Medium provou ser uma das minhas melhores decisões para compartilhar minha experiência e jornada de aprendizado. muitos entusiastas da ciência de dados e pessoas que pensam como você.

Obrigado por estar comigo durante toda a minha viagem de equitação e espero compartilhar mais com você em 2019!

Então … Voltemos ao tópico de interesse hoje.

Na verdade, essa foi uma das minhas dificuldades quando comecei no campo da ciência de dados. Curiosamente, este é também um dos tópicos de debate mais comuns entre os cientistas de dados.

Então agora a questão é: os cientistas de dados devem saber como escrever o código de produção?

Aqui está a minha resposta: sim .

O código de produção é um código estável e bem testado que considera os cenários da vida real e deve ser robusto para funcionar.

E ter a capacidade de escrever um código em nível de produção é uma das habilidades mais procuradas como cientista de dados para uma empresa.

Boas notícias para você se você é um engenheiro de software que se tornou cientista de dados, já que você pode ter desenvolvido esse conjunto de habilidades através da criação de vários códigos de produção para implantação em suas funções anteriores.

Se você é como eu, que não é nem ex-engenheiro de software nem uma pessoa com formação em ciência da computação, sei como se sente e é por isso que este artigo é para você.

Vamos começar!

Por que código de produção?

Por quê?

Por que nós – como cientista de dados – devemos nos preocupar em escrever código de produção?

Porque é aqui que nossas análises e modelos realmente agregam valores aos nossos usuários finais. Sem a implantação de modelos após meses agonizantes (ou mesmo anos) de desenvolvimento de modelos, os modelos permanecerão sempre como modelos se não trouxerem benefícios aos clientes ou usuários finais.

Todas essas longas horas de coleta e limpeza de dados, construção e otimização de modelos e apresentação destinam-se a mostrar que seus modelos são capazes de gerar resultados e insights para atingir os objetivos de negócios.

Uma vez que você convenceu as partes interessadas com sucesso (desde que seus modelos sejam robustos, a análise faz sentido do ponto de vista comercial e os resultados são capazes de atingir as metas de negócios), a fase de implantação não estará muito distante e é quando você precisa colocar modelos em produção, fornecendo código de nível de produção.

Para ser brutalmente honesto, seu chefe não se importa com os modelos que você usou. O que ele / ela se importa é simplesmente os RESULTADOS.

Então, entregue os resultados e você está pronto para ir.

Mais uma vez, depende.

Eu diria que não há necessidade de saber como escrever código de qualidade de produção para se tornar um cientista de dados.

No final do dia, isso depende …

Na minha experiência, algumas empresas e clientes com os quais trabalhei precisavam de análises e modelos de dados, construindo principalmente para sua análise interna e uso.

Isso pode significar que os interessados simplesmente querem saber o desempenho das métricas de negócios com base em dados históricos ou como seus modelos podem tornar as operações de negócios mais eficientes e econômicas. Nesses casos, talvez você não precise escrever o código de produção de acordo com os objetivos do negócio.

Para algumas outras empresas, é necessário ter código pronto para produção para ser integrado ao sistema existente antes de ser implantado para os usuários finais.

Há precisamente uma das razões pelas quais algumas descrições de trabalhos de cientistas de dados não incluem a habilidade de código de produção como um dos requisitos, mas sim mais uma das habilidades preferenciais, pois podem ter uma equipe de engenheiros de software ou pessoas de TI para ajudar a produzir modelos.