Data Science com Optimus. Parte 3: Entendendo seus dados.

Antes de enlouquecer criando modelos, você precisa primeiro entender seus dados. Este tutorial explicará como fazer isso no ambiente que estamos criando.

Favio Vázquez Segue 19 de jul · 5 min ler Ilustração de Héizel Vázquez

Como eu disse antes:

Os dados vêm primeiro.

Mas mesmo antes disso (como antes do Big Bang) você precisa entender matemática, cálculo, estatística e o problema que está resolvendo.

O molho secreto que as grandes empresas de tecnologia usam é a grande compreensão de seus dados e definições muito específicas para projetos.

Como você pode imaginar, os dados são um ativo importante (talvez o mais importante) para as empresas agora. Então, antes que você possa aplicar aprendizado de máquina ou aprendizado profundo, você precisa ter, saber o que você tem, entender, governar, limpar, analisar, padronizar (talvez mais) e então você pode pensar em usar isto.

Este artigo é uma revisão de um ótimo repo feito com o Pandas e por quê? Porque você pode comparar todo o código e ver como fazer isso no Pandas e com o Spark e o Optimus. Este é o repo original:

guipsamora / pandas_exercises

Pratique suas habilidades de pandas! Contribua para o desenvolvimento de guipsamora / pandas_exercises criando uma conta no GitHub.

github.com