Os 6 projetos de Aprendizado de Máquina mais úteis do ano passado (2018)

George Seif Blocked Desbloquear Seguir Seguindo 1 de janeiro

O ano passado foi ótimo para a IA e Aprendizado de Máquina. Muitas novas aplicações de alto impacto do Machine Learning foram descobertas e trazidas à luz, especialmente em saúde, finanças, reconhecimento de voz, realidade aumentada e aplicações 3D e vídeo mais complexas.

Temos visto um grande impulso em direção a mais pesquisa orientada a aplicativos, em vez de teórica. Embora isso possa ter seus inconvenientes, por enquanto tem sido feito um grande impacto positivo, gerando novas P & D que podem rapidamente se transformar em negócios e valor para o cliente. Essa tendência é fortemente refletida em grande parte do trabalho de código aberto do ML.

Vamos dar uma olhada nos 6 projetos de ML mais praticamente úteis do ano passado. Esses projetos publicaram códigos e conjuntos de dados que permitem que desenvolvedores individuais e equipes menores aprendam e criem valor imediatamente. Eles podem não ser os trabalhos mais inovadores do ponto de vista teórico, mas são aplicáveis e práticos.

Fast.ai

A biblioteca Fast.ai foi criada para simplificar o treinamento de redes neurais rápidas e precisas usando as melhores práticas modernas. Ele abstrai todo o minucioso trabalho que pode vir com a implementação de redes neurais profundas na prática. É muito fácil de usar e é projetado com mentalidade de construção de aplicativo do praticante. Originalmente criada para os alunos do curso Fast.ai, a biblioteca é escrita em cima da biblioteca Pytorch, fácil de usar, de uma maneira limpa e concisa. Sua documentação é de primeira qualidade também.

Detectron

Detectron é a plataforma de pesquisa do Facebook AI para pesquisa de detecção de objetos e segmentação de instâncias, escrita em Caffe2. Ele contém implementações de uma ampla variedade de algoritmos de detecção de objetos, incluindo:

  • Máscara R-CNN : Detecção de objetos e segmentação de instâncias usando uma estrutura R-CNN mais rápida
  • RetinaNet : Uma rede baseada em pirâmide de recursos com uma Perda Focal exclusiva para lidar com exemplos concretos.
  • R-CNN mais rápida : a estrutura mais comum para redes de detecção de objetos

Todas as redes podem usar um dos vários backbones de classificação opcionais:

Ainda mais, todos eles vêm com modelos pré-treinados no conjunto de dados COCO, para que você possa usá-los imediatamente. Eles já foram testados usando métricas de avaliação padrão no zoológico modelo Detectron .

Detectron

FastText

Outra pesquisa do Facebook, a biblioteca fastText é projetada para representação e classificação de texto. Ele vem com modelos pré-treinados de vetores de palavras para mais de 150 idiomas. Esses vetores de palavras podem ser usados para muitas tarefas, incluindo classificação de texto, sumarização e tradução

AutoKeras

Auto-Keras é uma biblioteca de software de código aberto para aprendizado automatizado de máquina (AutoML). Foi desenvolvido pelo DATA Lab na Texas A & M University e colaboradores da comunidade. O objetivo final do AutoML é fornecer ferramentas de aprendizagem profunda de fácil acesso a especialistas de domínio com conhecimento limitado em ciência de dados ou aprendizado de máquina. Auto-Keras fornece funções para procurar automaticamente a melhor arquitetura e hiperparâmetros para modelos de aprendizagem profunda.

Dopamina

A dopamina é uma estrutura de pesquisa para prototipagem rápida de algoritmos de aprendizagem por reforço, criada pelo Google. O objetivo é ser flexível, porém fácil de usar, implementando algoritmos, métricas e benchmarks padrão de RL.

De acordo com a documentação da Dopamine, seus princípios de design são:

  • Experimentação fácil : para ajudar novos usuários a realizar experiências de referência
  • Desenvolvimento flexível : para facilitar a geração de ideias novas e inovadoras para novos usuários
  • Compacto e confiável : forneça implementações para alguns dos algoritmos mais antigos e mais populares
  • Reprodutível : Garantir resultados reproduzíveis

vid2vid

O projeto vid2vid é uma implementação pública do Pytorch do avançado algoritmo de síntese de vídeo para vídeo da Nvidia. O objetivo da síntese de vídeo para vídeo é aprender uma função de mapeamento de um vídeo de origem de entrada (por exemplo, uma sequência de máscaras de segmentação semântica) para um vídeo foto-realista de saída que retrata precisamente o conteúdo do vídeo de origem.

O melhor desta biblioteca são as suas opções: ela fornece vários aplicativos vid2vid diferentes, incluindo cenas de auto-direção / urbanas, rostos e pose humana. Ele também vem com instruções e recursos abrangentes, incluindo o carregamento de conjuntos de dados, avaliação de tarefas, funcionalidade de treinamento e multi-gpu!

Convertendo um mapa de segmentação para uma imagem real

Menções honrosas

  • ChatterBot: aprendizado de máquina para mecanismo de diálogo conversacional e criação de bots de bate-papo
  • Kubeflow: kit de ferramentas de aprendizado de máquina para o Kubernetes
  • imgaug: aumento de imagem para aprendizagem profunda
  • desequilibrado-aprende: um pacote python sob o scikit aprende especificamente para anexar conjuntos de dados desbalanceados
  • mlflow: plataforma de código aberto para gerenciar o ciclo de vida do ML, incluindo experimentação, reprodutibilidade e implantação.
  • AirSim: simulador para veículos autônomos construído no Unreal Engine / Unity, da Microsoft AI & Research