Matemática para Ciência de Dados

Oprimido por procurar recursos para entender a matemática por trás da ciência de dados e aprendizado de máquina? Nós temos você coberto.

Ibrahim Sharaf ElDen Blocked Desbloquear Seguir Seguindo 12 de janeiro

Motivação

Aprender a base teórica para a ciência de dados ou aprendizado de máquina pode ser uma experiência assustadora, pois envolve vários campos da matemática e uma longa lista de recursos on-line.

Nesta parte, meu objetivo é sugerir recursos para construir o conhecimento matemático necessário para começar a trabalhar na prática de ciência de dados / trabalho de pesquisa. Essas sugestões são derivadas da minha própria experiência no campo da ciência de dados e seguem os últimos recursos sugeridos pela comunidade.

No entanto, se você é um iniciante em aprendizado de máquina e procura obter um emprego na indústria, eu não recomendo estudar toda a matemática antes de começar a fazer um trabalho prático real, essa abordagem ascendente é contraproducente e você será desencorajado , como você começou com a teoria ( maçante? ) antes da prática ( diversão! ).

Meu conselho é fazer o contrário (abordagem top-down), aprender a codificar, aprender a usar a pilha PyData (Pandas, sklearn, Keras, etc.), sujar as mãos criando projetos reais, usar documentações de bibliotecas e tutoriais do YouTube / Media. ENTÃO , você começará a ver o quadro maior, notando sua falta de formação teórica, para realmente entender como esses algoritmos funcionam, nesse momento, estudar matemática fará muito mais sentido para você!

Aqui está um artigo da incrível equipe fast.ai , apoiando a abordagem de aprendizagem de cima para baixo

Fornecendo uma boa educação em Deep Learning · fast.ai
Infelizmente, é aqui que vários dos poucos recursos em aprendizado profundo começam a pedir aos alunos que acompanhem… www.fast.ai

E outro por Jason Brownlee em seu blog "Machine Learning Mastery" de mina de ouro

Você está fazendo isso errado. Por que o aprendizado de máquina não precisa ser tão difícil
Tópicos técnicos como matemática, física e até ciência da computação são ensinados usando uma abordagem de baixo para cima. Isso… machinelearningmastery.com

Recursos

Vou dividir os recursos em 3 seções (Álgebra Linear, Cálculo, Estatística e probabilidade), a lista de recursos não estará em nenhuma ordem específica, os recursos serão diversificados entre tutoriais em vídeo, livros, blogs e cursos on-line.

Álgebra Linear

Usado em aprendizado de máquina (e aprendizado profundo) para entender como os algoritmos funcionam sob o capô. Basicamente, é tudo sobre operações vetoriais / matriciais / tensoras, nenhuma magia negra está envolvida!

  1. Série Khan Academy Linear Algebra (amigável para principiantes).
  2. Codificando o curso Matrix (e livro).
  3. Série de Álgebra Linear 3Blue1Brown .
  4. fast.ai Curso de Álgebra Linear para codificadores , altamente relacionado ao fluxo de trabalho ML moderno.
  5. Primeiro curso em Matemática Coursera para especialização em Machine Learning .
  6. Livro “Introdução ao Álgebra Linear Aplicada – Vetores, Matrizes e Mínimos Quadrados”.
  7. Curso de Álgebra Linear do MIT , altamente abrangente.
  8. Revisão da Álgebra Linear de Stanford CS229 .

Cálculo

Usado em aprendizado de máquina (e aprendizado profundo) para formular as funções usadas para treinar algoritmos para alcançar seu objetivo, conhecido por funções de perda / custo / objetivo.

  1. Khan Academy Calculus series (amigável para principiantes).
  2. 3Blue1Brown Calculus series .
  3. Segundo curso em Matemática Coursera para especialização em Machine Learning .
  4. O cálculo de matriz que você precisa para o papel de aprendizado profundo .
  5. Cálculo Variável Simples MIT .
  6. Cálculo Multivariável do MIT .

Estatísticas e Probabilidade

Usado em ciência de dados para analisar e visualizar dados, a fim de descobrir (inferir) insights úteis.

  1. Estatísticas da Khan Academy e séries de probabilidade (amigável para principiantes).
  2. Introdução à Estatística Descritiva da Udacity .
  3. Introdução às Estatísticas Inferenciais da Udacity .
  4. Estatística com R Especialização do Coursera .
  5. Revisão da Teoria da Probabilidade de Stanford CS229 .

Materiais de bônus

  1. Primeira parte do livro Deep Learning .
  2. Fundo da matemática de CMU para o curso do ML .
  3. A lista de reprodução Math of Intelligence de Siraj Raval .

Então, fui eu dando minha pasta de marcadores de matemática cuidadosamente selecionada para o bem comum! Espero que ajude você a expandir seu conhecimento de aprendizado de máquina e lute contra seu medo de descobrir o que está acontecendo nos bastidores de suas instruções de importação sklearn / keras / pandas.

Suas contribuições são muito bem-vindas, através da revisão de um dos recursos listados ou da adição de novos recursos impressionantes.