Data Career Market Insights em Toronto: Indeed.ca

Taesun Yoo Blocked Unblock Seguir Seguindo 9 de julho Figura 0. De fato, Resultados da Pesquisa de Jobs em Carreira de Dados Relacionados

Este é um momento fascinante para encontrar a carreira dos seus sonhos em Toronto. Toronto está se tornando um ponto quente (ou seja, hub de inteligência artificial) para grandes empresas de software digital de dinossauros como Microsoft, Amazon e até mais. Eles estão procurando contratar talentos em cargos como cientista de dados, engenheiro de dados, analista de dados e business intelligence. É a pergunta mais comum para os recém-formados e os que mudam de carreira que como posso realizar minha carreira de sonho?

Em muitos casos, a maioria das pessoas entra em um site de busca de emprego como o Indeed.ca e digita algumas palavras-chave (ou seja, título do trabalho, algumas ferramentas, etc.) para recuperar os resultados da procura de emprego. Então, uma a uma, as pessoas analisam as descrições de funções e enviam as inscrições para o maior número possível. ERRADO!

Existem algumas razões pelas quais você não deve fazer isso:

1. Esforço desperdiçado e tempo : você está desperdiçando seu tempo, bem como contratando empresas (RH) tempo para filtrar toneladas de currículos irrelevantes que podem até não se encaixar para o que eles estão olhando.

2. Você quer maximizar a sua chance de conseguir uma entrevista : já se imaginou saindo em guerra sem estar armado? Da mesma forma, você deve ter pelo menos o conjunto de ferramentas básico necessário para ser considerado pela contratação de gerentes.

Então o que nós podemos fazer? Não se preocupe, nós podemos estrategicamente tornar as coisas um pouco mais fáceis usando a biblioteca Python (Beautiful Soup). Com essa biblioteca, podemos criar uma função de raspador da Web para recuperar seus resultados de pesquisa de trabalho em Toronto em Indeed.ca. Isso nos ajudará a enviar a proposta de emprego de maneira estratégica e a priorizar suas metas para o aprendizado de conjunto de ferramentas necessárias em futuras submissões de trabalhos.

Antes de entrarmos, vamos começar com 5 perguntas-chave para obter algumas ideias:

1. Que empresas estão procurando contratar esses talentos (por exemplo, Data Scientist, Data Engineer, etc.)

2. Quais são os salários médios desses diferentes papéis?

3. Quais são as 5 principais habilidades obrigatórias exigidas para esses diferentes papéis?

4. Qual é o nível de escolaridade requerido ou recomendado para esses diferentes papéis?

5. Quais são os antecedentes educacionais preferidos (áreas de estudo) para esses diferentes papéis?

Ok, aqui está uma visão geral rápida do data wrangling pipeline para a função Indeed Job Scraper que construí para responder a estas cinco questões principais:

Figura 1. Realmente Pipeline de Dados do Scraper

Etapa 1. Conectar-se à página do URL de pesquisa de emprego

Etapa 2. Tokenize, analise as palavras e faça alguma limpeza de texto.

Etapa 3. Crie a função principal para coletar a descrição da página da tarefa (cargo, local, salário, etc.)

Etapa 4. Faça um loop por cada URL da página e informações armazenadas.

Passo 5. Crie dicionários para capturar as habilidades necessárias, nível de educação, etc. Conte a frequência do termo em cada termo especificado e visualize os resultados!

Vamos mergulhar nas 5 percepções vitais significativas que obtivemos com os resultados.

A. Lista de Contratantes e o Salário Médio para Funções de Cientistas de Dados:

Figura 2. Lista de empresas de Indeed.caFigure 3. Salário médio listado de Indeed.ca

Primeiro, os trabalhos de cientista de dados são encontrados em vários setores. A maioria dos empregos é em empresas financeiras ou de seguros, como TD, Scotiabank, Sun Life Financial, etc. Para outras carreiras, tendências semelhantes são observadas. Exceto, apenas empresas diferentes estão procurando contratar talentos.

Em segundo lugar, um salário médio anual de cientista de dados é relatado como US $ 91.000 em Toronto. No entanto, este salário é um pouco fora de 5 a 10K do salário médio encontrado no Indeed.ca. Isso ocorre porque algumas observações incluíram também salários para funções de cientistas de dados seniores. Realisticamente, um salário médio anual de um cientista de dados de nível de entrada seria algo entre 80 e 85K .

B. Comparação entre o Cientista de Dados e o Engenheiro de Dados pelas Cinco Principais Competências Requeridas

Esta figura representa as cinco habilidades mais exigentes, DevOps e ferramenta de nuvens para cada profissão. Aqui está um resumo entre duas posições com base na semelhança (semelhança) e diferença.

Comunalidade :

Entre as 5 principais habilidades listadas, os cientistas de dados e os engenheiros de dados precisam conhecer as ferramentas como Python, Spark, Hadoop e SQL . Em que Python e SQL são as ferramentas fundamentais, enquanto o Spark e o Hadoop são essenciais para trabalhar para empresas com grande armazenamento de dados.

Diferença :

Para as funções de cientista de dados, as empresas contratantes estão mais concentradas em analisar outras ferramentas de análise de dados e a experiência de visualização de dados (ou seja, SAS, Tableau, etc.) . Por outro lado, as funções de engenheiro de dados são fortemente focadas em ferramentas como plataformas de nuvem (AWS) e DevOps (Jenkins, Kubernetes, Docker) .

Existem duas razões principais para essa diferença. Primeiro, os engenheiros de dados criam pipelines de dados para modelos de produção de ML criados por cientistas de dados. Eles precisam estar equipados com a experiência da ferramenta DevOps. Isso os ajuda a implementar práticas ágeis de ciclo de vida de implantação de modelo / código entre diferentes correções e lançamentos da maneira mais eficiente. Em segundo lugar, a maioria das empresas iniciantes ou de grande porte usa plataformas de nuvem, como a AWS, por ter uma solução no local (data warehouse interno) devido à sua flexibilidade e custo-benefício. Ainda assim, isso depende muito de outros fatores, como o roteiro estratégico / de negócios da empresa, a arquitetura do sistema e o ambiente.

C. Requisitos Educacionais e Antecedentes para Cientistas de Dados

Em relação ao nível de educação, um cientista de dados é a única profissão em que a maioria das empresas contratantes prefere contratar candidatos com Ph.D. nível educacional (figura à esquerda). Para outras profissões, como engenheiro de dados, analista de dados e funções de business intelligence, o nível de bacharel é suficiente para empregos.

Além disso, muitos candidatos a emprego se perguntarão que tipo de formação educacional ou campo de estudo é ideal para os cientistas de dados? A partir da análise, parece que a maioria das empresas que contratam querem candidatos do campo STEM, como ciência, tecnologia, engenharia e matemática. Especialmente para os cientistas de dados, muitas empresas querem candidatos com formação em matemática, ciência da computação, engenharia e assim por diante.

Então, por que isso está se tornando uma tendência para os cientistas de dados?

Eu coletei alguns insights fazendo algumas pesquisas por conta própria, de periódicos publicados, encontros de ciência de dados e bate-papos com mentores de cientistas de dados. Vamos começar com uma pergunta sobre por que a maioria das empresas que contratam querem o Ph.D. candidatos de nível.

Em primeiro lugar, com o ressurgimento das tendências da inteligência artificial (IA), há muitas empresas interessadas em construir suas próprias equipes de pesquisa e desenvolvimento de produtos de IA / aprendizagem profunda (DL). Eles querem pessoas que possuam conhecimento de algoritmos avançados de IA e DL. Não apenas use bibliotecas e pacotes existentes que já estão disponíveis em R e Python. Esses cientistas de dados devem ser capazes de ajustar e implementar novos algoritmos a partir do zero para resolver problemas comerciais específicos e construir produtos de dados.

Em segundo lugar, a matemática parece ser a disciplina acadêmica mais famosa que muitas empresas estão procurando contratar, seguida pelos cursos de ciência da computação e engenharia. Isso está bem conectado à natureza das funções do cientista de dados. Como um cientista de dados deve ser capaz de entender matemática bem dentro de áreas diferentes, como álgebra linear, cálculo e estatística. Já que todos os algoritmos de ML são sobre como entender como esses algoritmos podem ser aplicados a um conjunto de dados e formular a solução exclusiva para resolver problemas de negócios específicos. Além disso, os cientistas de dados devem fazer bem a programação. Essa é a razão pela qual muitas empresas querem candidatos com formação em ciências da computação ou engenharia. A maior parte do desenvolvimento de código / modelo é feito em Python / R e é essencial, como cientista de dados, escrever código de nível eficiente e escalonável na produção para realizar um trabalho.

Obrigado por ler este artigo. Espero que muitos leitores achem isso interessante. Eu incentivo os leitores de outros setores a considerar o aprendizado do Python e a criação de uma função de raspador da Web para as percepções do mercado de sua indústria