Como usei minhas fotos do Farewell da faculdade como Dataset de classificação de imagens

Abhik Sarkar Blocked Unblock Seguir Seguindo 27 de dezembro de 2018

Eu estava tentando construir um Sistema de Detecção de Imagem em que nós pudéssemos atender (na Índia, a freqüência à faculdade é um grande negócio!) De qualquer aula da faculdade usando fotos. Durante nossos dias de palestras tivemos 50 minutos de palestras nas quais cerca de 10 minutos são desperdiçados no atendimento e os professores têm que lidar com o problema do proxy também. Determinado a fazer um sistema automatizado, comecei a trabalhar para isso. Logo, eu cheguei a um plano, mas esse plano envolvia tirar mais de 100 fotografias de cada pessoa e eu estava em uma faculdade onde minha força de classe era 90. Então, eu precisava tirar manualmente mais de 9000 fotos de cada pessoa. Eu deixei cair então, pensando que eu não estou pronto para fazer minha carreira em Fotografia e eu deveria focalizar Aprendizado Profundo Em vez disso (se mostrou para ser uma escolha inteligente) e esqueci sobre isto.

Agora, o Deep Learning começou a avançar e novas possibilidades começaram a surgir. Aprendi sobre o aprendizado de uma única cena. O aprendizado one-shot é um problema de categorização de objetos na visão computacional, onde a maioria dos algoritmos de categorização de objetos baseados em aprendizado de máquina exige treinamento em centenas ou milhares de imagens e conjuntos de dados muito grandes. O aprendizado em uma única tentativa visa aprender informações sobre categorias de objetos de uma única alguns, treinando imagens. Então, agora eu precisava de aproximadamente 10 fotos por pessoa. Mas ainda cerca de 1000 fotos. A essa altura, comecei a procurar novas possibilidades. Então eu vim com uma idéia porque não usar fotos existentes em vez de levá-las sozinha. Pois, implementando-o, o FaceNet chamou minha atenção e então comecei minha missão de classificar fotos de meus amigos.

Em 2015, pesquisadores do Google publicaram um artigo, o FaceNet , que usa uma rede neural convolucional com base nos pixels da imagem como recursos, em vez de extraí-los manualmente. Atingiu uma nova precisão recorde de 99,63% no conjunto de dados LFW .

Trending AI Articles:

1. Uma Explicação de Aprendizado de Máquina Curta

2. Redes Neurais Naturais vs. Artificiais

3. AI do povo, pelo povo, para o povo

4. Detecção de rostos com OpenCV e Deep Learning da imagem

Antes de entrarmos nos detalhes da implementação, quero discutir os detalhes do FaceNet. Qual é a rede que usaremos em nosso sistema.